Você está na página 1de 13

Guia de Abertura de Dados

Minuta
01/09/2011
Sumrio
Introduo.............................................................................................................................................3
1. Objetivos......................................................................................................................................3
2. Pblico Alvo................................................................................................................................3
3. Como usar o documento..............................................................................................................3
4. Processo de construo do documento........................................................................................3
5. Governo Aberto Dados como Infraestrutura.............................................................................4
5.1. Conceitos Bsicos................................................................................................................4
5.2. Melhores Prticas.................................................................................................................5
Guia de Abertura de Dados...................................................................................................................7
1. Alinhamento com a EGTI 2011........................................................................................................7
2. Aspectos Gerenciais..........................................................................................................................7
1. Alinhamento estratgico para viabilizar o processo de abertura..................................................7
2. Definir os atores da iniciativa e seus papis................................................................................7
3. Levantar os grupos de dados para a abertura...............................................................................8
4. Plano de Divulgao e Participao.............................................................................................9
5. Plano de continuidade e manuteno.........................................................................................10
3. Aspectos Tcnicos...........................................................................................................................11
6. Modelar os dados antes da abertura...........................................................................................11
7. Determinar as interfaces e formatos dos pacotes de dados........................................................12
Introduo

1. Objetivos

Este documento pretende contextualizar e orientar as instituies detentoras de dados pblicos


no processo de disponibilizao desses dados de acordo com os princpios de Dados Abertos. As
orientaes cobrem aspectos gerenciais do processo de abertura, e devem ser utilizadas como
instrumento norteador para definio de um conjunto de aes para implantar uma cultura de
abertura de dados sustentvel, alinhada com os objetivos estratgicos da organizao e com as
demandas sociais por governos mais abertos.

O documento tambm fornece vrias orientaes tcnicas, auxilia na formao de uma equipe
com habilidades essenciais para Dados Abertos, e na sua gesto para atingir os objetivos de
publicao de dados. Para uma orientao tecnolgica mais aprofundada na construo da
soluo de dados abertos, a SLTI disponibiliza tambm um documento relatando a experincia
de abertura dos dados do Sistema de Cadastramento Unificado de Fornecedores - SICAF. Este
documento est em anexo, e segue todos os padres propostos e deve ser enxergado como
arquitetura modelo de referncia para solues de dados abertos.

2. Pblico Alvo

A publicao deste documento vem para sustentar as aes de abertura de dados em


consequncia da crescente demanda social por governos mais abertos. Neste sentido, o pblico
alvo so gestores responsveis pela administrao de sistemas de informao e de seus dados
nos mais diversos rgos pblicos interessados em fornecer acesso esses dados em formatos
abertos, reutilizveis, com facilidade de cruzamentos com outras fontes de dados seguindo as
melhores prticas atuais.

Apesar da mudana de cultura iniciar no alto escalo das organizaes, fundamental que os
responsveis diretos pela manuteno dos sistemas de informao estejam envolvidos no
planejamento e desenvolvimento das aes de abertura de dados. Grande parte dos sistemas de
informao dos rgos pblicos, assim como seus respectivos bancos de dados, tm sua
manuteno terceirizada. Nessas condies fundamental o entendimento desses atores quanto
aos objetivos pretendidos no processo de abertura de dados.

A estratgia de abertura de dados aqui apresentada defende que, uma vez que a sociedade o
maior beneficirio desses dados, deve considerar a participao social processo fundamental na
construo dos canais ideais de disseminao desses dados.

3. Como usar o documento

Este documento deve ser usado como um modelo e/ou roteiro dos procedimentos
organizacionais necessrios para publicao de dados abertos governamentais. Pode e deve ser
usado em conjunto com o Manual de Dados Abertos
(http://www.w3c.br/pub/Materiais/PublicacoesW3C/Manual_Dados_Abertos_WEB.pdf),
traduzido e adaptado a partir do Open Data Manual (http://opendatamanual.org) da Open
Knowledge Foundation.

4. Processo de construo do documento

3
Esta minuta uma proposta elaborada pelo Time de Dados Abertos da Secretaria de Logstica e
Tecnologia da Informao SLTI e pelo grupo de trabalho da Infraestrutura Nacional de Dados
Abertos INDA.

A proposta baseada em algumas experincias de Publicao de Dados Abertos na Dataprev e


no Ministrio do Planejamento. So consirados, ainda, casos de sucesso internacionais, tais
como os padres, as licenas, os catlogos e os formatos de dados publicados nas iniciativas de
Dados Abertos dos Estados Unidos da Amrica e do Reino Unido, bem como as ferramentas da
Open Knowledge Foundation.

O momento atual de submisso para apreciao dos participantes, tomadores e formadores de


opinio da e-PING, de governo, da academia e da sociedade organizada, visando formar uma
comunidade para o desenvolvimento colaborativo do guia e de um movimento coordenado de
Abertura de Dados do Brasil.

5. Governo Aberto Dados como Infraestrutura

As tecnologias disponibilizadas nos anos recentes tm proporcionado o desenvolvimento de


diversas ferramentas que aumentam a capacidade da sociedade em assumir seus direitos e
obrigaes cvicas. A incluso digital, a informatizao dos procedimentos governamentais e a
integrao entre os diversos repositrios de dados pblicos gera crescentes demandas da
populao por mais transparncia e participao atravs de meios tecnolgicos.

Nessa direo governos de diversos pases esto definindo polticas e desenvolvendo


plataformas tecnolgicas no intuito de promover a disseminao das informaes pblicas de
maneira a possibilitar a reutilizao, principalmente pela sociedade, de forma automatizada
atravs da Internet. Principais referncias so os governos americano e britnico.

De maneira geral a sociedade (grupos organizados, iniciativa privada, grupos acadmicos, etc.)
tm a capacidade de cruzar informaes de diversas fontes e desenvolver aplicaes e servios
que resolvam demandas de grupos especficos da sociedade. Essa estratgia beneficia no s a
sociedade mas tambm o governo uma vez que transfere para a sociedade o provimento de
servios que muitas vezes no esto dentre suas prioridades. muito importante perceber a
gama de aplicaes que a sociedade capaz de desenvolver.

Por outro lado, na medida em que mais dados governamentais estejam disponveis de forma
aberta, espera-se que o prprio governo passe a gradualmente utilizar esses dados abertos como
plataforma de gil de integrao entre sistemas de informao, assim promovendo a
interoperabilidade dentro da esfera pblica. Alm disso, essas integraes so benficas, ainda,
no sentido de tornar as iniciativas de dados abertos algo permanente e sustentvel, na medida
em que o prprio governo passe a depender delas. Portanto, faz sentido como estratgia de
Abertura de Dados estimular o consumo pelo governo de dados abertos governamentais.

5.1. Conceitos Bsicos

O movimento internacional de abertura de dados governamentais est embasada em 3 leis


propostas por David Eaves:

4
1. Se o dado no pode ser encontrado e indexado na web, ele no existe.
2. Se no estiver aberto e em formato compreensvel por mquina, ele no pode ser
reaproveitado.
3. Se algum dispositivo legal no permitir sua reaplicao, ele no til.

Para maior esclarecimento o Open Government Working Group definiu 8 princpios:

1. Completos: Todos os dados pblicos esto disponveis. Dado pblico o dado que no est
sujeito a limitaes vlidas de privacidade, segurana ou controle de acesso.
2. Primrios: Os dados so apresentados tais como os coletados na fonte, com o maior nvel de
granularidade e sem agregao ou modificao.
3. Atuais: Os dados so disponibilizados to rapidamente quanto necessrio preservao do
seu valor.
4. Acessveis: Os dados so disponibilizados para o maior alcance possvel de usurios e para o
maior conjunto possvel de finalidades.
5. Compreensveis por mquinas: Os dados so razoavelmente estruturados de modo a
possibilidar processamento automatizado.
6. No discriminatrios: Os dados so disponveis para todos, sem exigncia de requerimento
ou cadastro.
7. No proprietrios: Os dados so disponveis em formato sobre o qual nenhuma entidade
detenha controle exclusivo.
8. Livres de licenas: Os dados no esto sujeitos a nenhuma restrio de direito autoral,
patente, propriedade intelectual ou segredo industrial. Restries sensatas relacionadas
privacidade, segurana e privilgios de acesso devem ser permitidas.

5.2. Melhores Prticas

Abaixo, uma seleo de boas prticas na publicao de dados abertos, levantada em uma anlise
nos portais de disseminao de dados, em conformidade com as orientaes do W3C:

1. Identificador Persistente

A no persistncia dos identificadores dificulta a busca e o encontro dessas informaes,


segundo as trs leis de David Eaves, se o dado no pode ser encontrado e indexado na web, ele
no existe. Alm disso, os identificadores devem ser tais que o usurio possa inferir alguma
informao til sobre aquilo que identificam.

2. Metadados

Segundo o W3C, Sem documentao, os dados no so muito teis. Quando possvel, deve-se
usar padres da indstria, tais como aqueles baseados em XML/RDF, que normalmente so auto
Documentveis. . A atribuio de Metadados facilita o processamento por mquinas e o
correlacionamento de dados pelas pessoas.

3. Padres de arquivo aberto

Para que o acesso a esses dados ocorra de maneira isonmica, necessrio que eles possam ser

5
interpretados por ferramentas gratuitas e possuam formatos abertos.

4. Clareza nos direitos de Uso

Levando em considerao que os dados esto sendo divulgados publicamente, necessrio que
sejam explicitados os direitos de uso dessas informaes, e que seja analisado quais so
possveis de se utilizar abertamente.

5. Ferramentas para consulta e indexao

Com o atual volume de dados existente nas bases do governo, nada mais adequado que sua
correta organizao e indexao, o aspecto mais importante manter esses dados ordenados de
uma forma que o leigo possa encontrar o que quer.

To importante quanto a organizao dos dados o provimento de uma ferramenta que facilite
seu encontro, uma ferramenta de busca bem estruturada ajuda o interessado a encontrar seus
dados de forma mais rpida e garante seu retorno quando precisar de novas informaes.

6. Ambiente de feedback

No menos importante que os demais, o ambiente de feedback a ferramenta essencial para


proporcionar a melhoria contnua da qualidade do portal de disseminao.

Ao passo que existe sua importncia, evidente que existe um grande custo envolvido em ouvir
as sugestes e ter o comprometimento de implementar a melhoria.

Esse ambiente, caso seja de fato administrado e utilizado, um marco para a maturidade de um
portal ou sistema de disseminao.

6
Guia de Abertura de Dados

1 Alinhamento com a EGTI 2011

Na ltima edio deste documento, a EGTI 2011 ainda estava em fase de desenvolvimento.
Entretanto, como ferramenta de planejamento e alinhamento do SISP, prover algumas
diretrizes que geraro a necessidade de publicar dados pblicos em padres abertos. Dentre elas,
a principal a da transparncia governamental.

Essa necessidade resultou na elaborao deste documento, que pretende atingir parte desse
objetivo e ir alm das expectativas, trazendo no s os previsveis benefcios das combinaes
dos dados governamentais, mas criando uma plataforma de colaborao, firmando um marco na
participao do cidado nas prticas do Estado.

2 Aspectos Gerenciais

Este documento prope uma atividade transversal e longitudinal s diversas reas e hierarquias
da organizao, portanto sentiu-se a necessidade de divid-lo em duas linhas de viso, gerencial
e tcnica, os tpicos a seguir orientam a primeira delas.

1. Alinhamento estratgico para viabilizar o processo de abertura

Entende-se que esse momento de articulaes muito especfico para cada instituio, aqui
que o coordenador da iniciativa garante, atravs do patrocinador, o apoio das reas envolvidas
para prosseguir com o trabalho.

Para a obteno desse alinhamento, devem ser apresentados os objetivos da publicao de dados
abertos e seus benefcios, a viso de que os dados abertos so um recurso estratgico substitui a
antiga idia de que dado um subproduto da atividade do governo.

A cultura da inteligncia de negcio, atualmente utilizada como um diferencial competitivo na


iniciativa privada mundial, um caso de sucesso que demonstra de que maneira o governo pode
e deve ser mais eficiente. O reuso dos indicadores de resultados j uma cultura nacional, o que
falta um processo coordenado no qual a essa reutilizao e anlise possa ser feita de diversas
maneiras diferentes. Um exemplo prtico: ao invs de investir em tratamento e anlise de dados,
direcionar esse investimento na publicao desses dados e promoo da anlise de maneira
colaborativa com a sociedade organizada, transformar o governo numa plataforma de
colaborao, o governo 2.0.

Um exemplo de produto dessa fase um documento formalizando o incio do processo de


abertura, com apoio e aprovao dos tomadores de deciso da organizao.

2. Definir os atores da iniciativa e seus papis

A definio dos responsveis importante para formalizar a vinculao do nus aos

7
representantes das reas envolvidas, a seguir a representao dos que so considerados os
principais responsveis no processo de abertura:

2.1. rgo central de suporte e controle s aes


Promove encontros peridicos para criao e evoluo dos modelos de plano de ao e
manuteno dos dados, com fim de formalizar um processo integrado de governo: SLTI.

2.2. Patrocinador
Responsvel pela Iniciativa, principal interessado na abertura dos dados, Executivo de
nvel superior do rgo.

2.3. Coordenador/Articulador
Responde pela execuo do processo de abertura, articula entre os responsveis tcnicos e
gestores de negcio.

2.4. Gestor Negocial


Tem a capacidade de identificar os dados a serem abertos, os dados de risco, dados
confidenciais. Tem conhecimento dos processo de negcio.

2.5. Gestor Tcnico


Deve dominar, na organizao, os assuntos de ambiente e segurana e conhecer os sistemas
de suporte rea de negcio, responde tambm pelas aes tcnicas do processo de
abertura(extrao e apresentao dos dados).

2.6. Usurio do dado


Cliente final do dado aberto, pessoa fsica ou jurdica que tem interesse de acesso quele
dado: Sociedade civil, em especial os hackers civis, iniciativa privada e os prprios gestores
pblicos.

3. Levantar os grupos de dados para a abertura

Aps o mapeamento dos envolvidos no processo de abertura, so iniciadas as atividades


conjuntas de levantamento dos dados passveis de abertura. Antes mesmo que os dados sejam
preparados e efetivamente publicados, preciso encontr-los, simplific-los e adquirir
permisso para disponibiliz-los.

Em teoria o movimento de abertura de dados prega a publicao total dos dados o mais rpido
possvel. Porm, os recursos disponibilizados aos rgos possuidores dos dados no prevem
aes de publicao dos dados nos moldes atualmente discutidos. As aes sugeridas a seguir
consideram a colaborao como pea importante na priorizao dos dados a serem publicados,
otimizando a utilizao dos recursos e reduzindo as incertezas quanto ao impacto das
publicaes.

3.1. Levantar os grupos de dados possuidos pela organizao:


O primeiro passo conhecer os ativos do rgo. Para que todos os grupos de dados sejam
elicitados essencial o conhecimento dos negcios operacionais geridos pelo rgo. O
levantamento deve cobrir quais so os dados, gerados ou mantidos, cujo o rgo
responsvel. O Gestor Negocial deve analisar os processos de negcio do rgo e identificar
todos os grupos de dados produzidos no processo.
Participantes: Coordenador e Gestor Negocial.

8
3.2. Obter autorizao para publicao dos grupos de dados do rgo:
Para que um grupo de dados seja disponibilizado publicamente imprescindvel um
levantamento jurdico e permisso formal da instncia responsvel, isso porque podem
existir instrumentos jurdicos, portarias, instrues normativas ou afins que probam a
publicao de certas informaes. Deve-se tomar como premissa que todos os dados podem
ser liberados, e remover aqueles que possuem alguma restrio. importante enfatizar que
mesmo parcialmente publicado, um grupo de dados agrega algum valor. aceitvel que
motivos relacionados a segurana nacional e estratgia de governo restrinjam os dados, mas
justificativas fortalecem a atuao transparente do rgo.
Participantes: Coordenador e Gestor Negocial.

3.3. Definir metadados preliminares:


O movimento de abertura de dados est embasado em algumas leis e princpios que
defendem o acesso irrestrito e automatizvel aos dados. Porm, para o sucesso do
movimento importante facilitar a compreeso dos dados. Se um pacote de dados publicado
no est gerando concluses ou algum servio, ento ele no atingiu a expectativa inicial.
papel do provedor dos dados fornecer artefatos suficientes permitindo a mxima utilizao
do valor agregado nos dados.

Sugerimos a utilizao de uma abordagem incremental. No primeiro momento importante


a construo de metadados suficientes para que um usurio externo conhea a definio e
escopo dos dados.

3.4. Determinar quais grupos de dados so mais relevantes para abertura:


O movimento de abertura de dados prega que todos os dados devem ser disponibilizados o
mais rpido possvel. Porm, os recursos envolvidos so escassos diante do montante de
dados que podem ser disponibilizados. Para que a abertura alcane bons nveis de satisfao
necessrio um planejamento enxuto priorizando a abertura dos dados mais importantes. A
definio do que importante est relacionada ao valor percebido pelo consumidor dos
dados.

Recomendamos a utilizao de uma abordagem colaborativa para definio das prioridades


de abertura. Possibilitar que os usurios dos dados exponham suas ideias e
colaborativamente definam quais dados so necessrios para implement-las, reduz as
incertezas quanto ao impacto e alcane da abertura posterior. A definio dos metadados
preliminares, descrita no tpico 3.3, essencial para que os usurios vislumbrem as
possibilidades .
Participantes: Coordenador, Gestor Negocial, Gestor Tcnico e Usurio.

4. Plano de Divulgao e Participao

O objetivo dos esforos de divulgao maximizar o alcane e o impacto das aes de


abertura de dados. Por causa disso, considerando que o paradigma de dados abertos
orientado promoo da transparncia, colaborao e participao, torna-se essencial a
existncia de um plano de divulgao para alcance dessa meta.

O consumidor uma pea essencial no uso dos dados abertos, portanto o plano deve conter
aes para seu envolvimento ainda no momento de definio dos pacotes de dados a serem

9
publicados. Essa colaborao aumenta a transparncia da ao e reduz as incertezas quanto
aos resultados da abertura dos dados.

O plano de divulgao pode ser especializado para cada tipo de usurio dos dados. A
definio de papis prope o melhor aproveitamento dos colaboradores de acordo com o
propsito de uso dos dados.

4.1. Sociedade civil


O cidado o principal usurio dos dados disponibilizados e suas aplicaes. O plano deve
conter aes informativas do movimento como um todo, esclarecendo motivao, benefcios
e meios de acesso. Tambm deve promover a utilizao das aplicaes que fazem uso dos
dados disponibilizados. Essas aplicaes fornecem as informaes contextualizadas
aumentando a percepo dos impactos das aes de governo, ou seja, maior transparncia.

4.2. Hackers civis


Grupos de cidados organizados e com capacidade tecnica. O plano deve previlegiar a
colaborao com esses grupos em vrias etapas do processo de abertura. Devem ser
percebidos como representantes da sociedade em termos tecnolgicos. Tm a capacidade de
especificarem os requisitos tcnicos de formato e meio de acesso aos dados. So
considerados pontes facilitadoras para acesso informao contida nos dados.

4.3. Acadmicos
As universidades e centros de pesquisa constituem grupos com capacidade tcnica e viso
de tendncia.

4.4. Gestores pblicos


Apesar de o movimento primar pela disponibilizao dos dados aos cidados, os gestores
pblicos tambm se beneficiaro. A abertura organizada e orquestrada dos diversos rgos
do governo, constitui uma oportunidade nica de interoperabilidade. Alm disso, os servios
e aplicaes desenvolvidas sobre os dados abertos tambm pode ser utilizado como
ferramenta de gesto. Na viso atual, essas aplicaes devem ser vistas como investimento
privado em prol do Governo.

O incentivo mais percebido para utilizao dos dados, diferente dos meios usuais, a
motivao do desenvolvimento de aplicaes atravs de torneios de programao. O
governo, provedor dos dados, promove torneios premiando quelas aplicaes inovadoras
socialmente reconhecidas. Alguns exemplos:
Apps for climate action(A4CA)
Apps for californians
Open.Up
Apps for democracy

5. Plano de continuidade e manuteno

Como esclarecido anteriormente, as aes descritas neste documento constituem esforos


iniciais para publicao de dados abertos. Todavia, imprescindvel planos de continuidade
do processo de abertura dos dados, o maior desafio dos governos que praticam a publicao
de dados abertos tornar suas iniciativas projetos sustentveis.
Nesse sentido, o plano deve cobrir dois aspectos:

10
5.1. Manuteno do processo de abertura
O modelo de processo sugerido neste documento prev a priorizao dos pacotes de dados a
serem abertos tendo em vista a disponibilidade de os poucos recursos. Porm, a abertura de
dados precisa ser encarada como assunto estratgico e incorporado aos processos de criao
de dados do rgo. O plano de continuidade deve prever aes para melhoria do processo de
abertura atravs do feedback do usurio e troca de experincias com outros rgos.

5.2. Manuteno dos dados j disponibilizados


O plano deve conter aes de manuteno dos pacotes de dados j publicados. A partir do
momento que o rgo disponibiliza um pacote de dados atavs de um endereo Web, assume
o compromisso de mant-lo. Grande parte dos dados so sries temporais que,
provavelmente, so gerados continuamente pelo rgo. O processo de abertura de um pacote
de dados deve prever sua atualizao indeterminada. A atualizao com verses mais
recentes dos dados deve acontecer sempre que possvel preservando seu valor agregado. A
frequncia de atualizao, e seus custos operacionais, devem ser considerados na etapa de
definio da cobertura temporal daquele pacote de dados.

3 Aspectos Tcnicos

6. Modelar os dados antes da abertura

6.1. Definir quais so os detalhes fundamentais a serem abertos, gerando um modelo inicial.
Dos grupos selecionados e autorizados, importante determinar quais so os dados centrais,
o eixo inicial que traz sentido na abertura daquele conjunto. Tomemos como exemplo o
grupo de dados de pagamento de benefcios da Previdncia Social: o maior interesse nesse
grupo em cima do benefcio em si, seu valor e qual a agncia pagadora, no entanto esse
dado tem seu valor anulado sem a data do pagamento do benefcio, e reduzido sem a
localizao da agncia.

Em torno dos dados fundamentais ser discutido o acrscimo dos demais para agregao de
valor, essa discusso ser muito mais proveitosa se contar com a participao dos usurios
que ajudaram na definio dos grupos de dados mais importantes.
Participantes: Coordenador, Gestor Negocial, Gestor Tcnico e Usurio.

6.2. Analisar aspectos de Privacidade, Segurana e Legalidade.


necessrio avaliar se a publicao desses dados pode comprometer algum desses itens em
seu estado natural:

Segurana nacional;
Segredos estratgicos de governo;
Direito de privacidade do cidado;
ou Legislao

Caso positivo ser necessria sua adequao: o procedimento comum o de anonimizao,


no qual so retirados do grupo os dados responsveis por esse comprometimento.

Cabe ressaltar que a anonimizao no se trata de simplesmente abstrair os dados que

11
identificam prontamente o objeto (normalmente pessoa), o processo usa como subsdio
anlises das formas de se desanonimizar os dados atravs de cruzamentos com outros
conjuntos de dados. Outra ressalva que quanto mais annimo o dado, menor sua utilidade,
portanto deve-se ser cauteloso ao retringir partes importantes dos dados.
Participantes: Coordenador, Gestor Negocial, Gestor Tcnico e Especialista em
anonimizao.

6.3. Definir conjunto de metadados a ser demonstrado para cada pacote de dados, um
informativo que descreve o que ser apresentado.
importante informar do que se trata um grupo de dados, isso pode ser feito com uma
interface prvia de apresentao dos dados. No estamos falando de web-semntica, esse
ainda um passo adiante, aqui os metadados so contextualizadores: faixa de tempo dos
dados, data de publicao, direitos de uso, etc.
Participantes: Coordenador, Gestor Negocial e Gestor Tcnico.

7. Determinar as interfaces e formatos dos pacotes de dados

A interface de acesso a um grupo de dados determinante para o sucesso da iniciativa. Sua


escolha deve equilibrar dois pontos: as restries trazidas por uma infraestrutura tecnolgica
limitada e a necessidade de se publicar dados em quantidade e com a maior qualidade
possvel.

Alguns grupos de dados podem ser pouco volumosos, o que justifica o uso de tecnologias
mais modernas e completas, no entanto, deve-se avaliar a taxa de atualizao desses dados e
seu consequente crescimento natural antes de adotar qualquer mtodo de publicao.

7.1. Levantamento das limitaes de infraestrutura.


Aqui devemos definir com relativa preciso quais so os recursos disponveis para essa
abertura, essas informaes, faro parte das variveis que restringiro as caractersticas
elegveis para os pacotes de dados e seu acesso.
Exemplos de limitaes:
Espao em servidores de dados;
Disponibilidade de servidores de aplicao;
Banda de rede;

7.2. Formatos.
A escolha do formato errado, dependendo do volume de dados possudos, pode gerar um
arquivo de tamanho muito grande. A manuteno e o elevado nmero de downloads
simultneos desse tipo de arquivo podem causar sobrecarga nos servidores. Um exemplo
comum a utilizao de um arquivo XML ou RDF no lugar de um CSV: essa escolha vai,
na melhor das hipteses, dobrar o tamanho do arquivo. Por outro lado, o valor agregado
resultante da riqueza de metadados introduzidos por esses formatos extremamente
vantajoso para o processamento automtico.

A deciso do formato deve ser baseada no equilbrio entre as limitaes de infra e a


quantidade de valor agregado desejado para os dados.

Exemplos de arquivos:
XML;
CSV;

12
RDF;
HTML.

7.3. Protocolo de acesso


Assim como na escolha do formato, o protocolo deve ser avaliado antes da adoo, alguns
meios de acesso podem exigir mais ou menos esforo do servidor ou at mesmo menos
banda de download.
Quando no se pode evitar a produo de arquivos de tamanhos grandes, uma boa sada para
escapar do trfego exorbitante o uso de Bit Torrent, o funcionamento do protocolo
baseado no compartilhamento distribudo dos arquivos, dividindo o acesso ao servidor com
outras pessoas que j fizeram download desses arquivos.

Exemplos de protocolos:
HTTP;
FTP;
Endpoint SPARQL;
Bit Torrent.

7.4. Cobertura dos pacotes


Para o consumidor dos dados custoso obter um arquivo enorme quando seu objetivo
acessar um conjunto de dados restrito. Uma aplicao que precisa consultar dados de
Pernambuco, por exemplo, reduz processamento e economiza tempo, se puder acessar um
pacote exclusivo do estado ou um da regio Nordeste.
Por outro lado, trabalhoso para o rgo disponibilizar 27 arquivos agrupando dados por
estado ao invs de 5 arquivos por regio ou 1 para o pas.
Segundo esses motivos, a cobertura de cada pacote uma deciso estratgica para a
publicao: ela influi diretamente em seus tamanhos e organizao.
Nos portais data.gov e data.gov.uk, as divises por coberturas geogrficas e temporais so
frequentes, explcitas nos metadados de contextualizao do usurio. Essas divises foram
feitas aps a percepo da vantagem tanto para o usurio quanto para a organizao.

Exemplos de dimenses de cobertura:


Geogrfica
Estadual
Regional
Municipal

Temporal
Semanal
Mensal
Trimestral
Anual

importante enfatizar que cada rgo deve fazer uma anlise individualizada e encontrar
outras dimenses relacionadas natureza do dado gerado ou manipulado.

13

Você também pode gostar