Você está na página 1de 44

DADOS

ABERTOS
O QUE SÃO DADOS ABERTOS ?
 Segundo Open Knowledge Internacional,

Dados são abertos quando qualquer pessoa pode livremente acessá-los, utilizá-los, modificá-
los e compartilhá-los para qualquer finalidade, estando sujeito a, no máximo, a exigências
que visem preservar sua proveniência e sua abertura.
O QUE SÃO DADOS ABERTOS ?
 Segundo a Open Definition,

Dados abertos são dados que podem ser livremente utilizados, reutilizados e redistribuídos por
qualquer pessoa - sujeitos, no máximo, à exigência de atribuição à fonte original e
compartilhamento pelas mesmas licenças em que as informações foram apresentadas. Ou seja,
a abertura de dados está interessada em evitar um mecanismo de controle e restrições sobre os
dados que forem publicados, permitindo que tanto pessoas físicas quanto jurídicas possam
explorar estes dados de forma livre.
O QUE SÃO DADOS ABERTOS ?
 Decreto 8.777,

Dados abertos - dados acessíveis ao público, representados em meio digital, estruturados em


formato aberto, processáveis por máquina, referenciados na internet e disponibilizados sob
licença aberta que permita sua livre utilização, consumo ou cruzamento, limitando-se a
creditar a autoria ou a fonte;
O QUE É UMA LICENÇA
ABERTA ?
 Licenças abertas são um conjunto de condições aplicadas a uma obra original que concedem permissão a
qualquer pessoa para fazer uso dessa obra, desde que sigam as condições da licença.
 Uma obra se refere a uma criação original, como um vídeo, música, documento ou software, que pode ser
protegido por direitos autorais.
 O proprietário dos direitos autorais - geralmente o criador da obra, seja um indivíduo, um grupo ou uma
empresa / organização - pode escolher licenciar abertamente seu trabalho se quiser que outros possam usá-
lo livremente, desenvolvê-lo, personalizá-lo ou melhorá-lo.
 Licenças abertas, portanto, dão permissão a qualquer pessoa para usar a obra sem nenhum custo, e
geralmente permitem que qualquer pessoa modifique a obra com nenhuma ou mínima restrição (como o
reconhecer o trabalho do autor original).
 Existem várias licenças abertas que seguem esses princípios, entre as mais comuns estão as licenças
Creative Commons para obras escritas, musicais, visuais e outras expressões artísticas; e GNU General
Public License para software. As condições exatas das licenças abertas estão disponíveis nas descrições
da licença.
O QUE É UMA LICENÇA
ABERTA ?
Segundo a Open Knowledge Foundation Network (OKF), as licenças abertas podem dispor de algumas
condições (e não restrições) para a (re)utilização dos dados, tais como:
 Atribuição à fonte original dos dados (BY);
 Renomeação do conjunto de dados caso tenham sido nele executadas modificações (integridade);
 Redistribuição sob a mesma licença ou termos de uso (share-alike, SA);
 Aviso sobre direitos autorais e identificação da licença original;
 Requisição de disponibilização dos dados já modificados em formato preferido para posterior
reutilização;
 Proibição de distribuição dos dados já modificados em formato que apresente restrições técnicas para
reutilização;
 Requisição de que eventuais patentes registradas a partir da reutilização dos dados originais não
agridam os titulares da licença
EXEMPLOS DE LICENÇAS
 A Open Knowledge Foundation Network lista alguns exemplos utilizados e reconhecidos pelo
mundo, classificadas segundo domínio (conteúdo ou bases de dados), exigência de atribuição
da fonte original (BY) e exigência de compartilhamento nos mesmos termos de uso
estabelecidos (share-alike, SA).

Fonte: Manual da CGDF


OUTRAS DEFINIÇÕES DO
DECRETO 8777
O decreto também trouxe outras definições relevantes. São elas:
a) Dado: sequência de símbolos ou valores, representados em qualquer meio,
produzidos como resultado de um processo natural ou artificial;
b) Dado acessível ao público: qualquer dado gerado ou acumulado pelo Governo que
não esteja sob sigilo ou sob restrição de acesso nos termos da Lei de Acesso à
Informação (Lei 12.527)
c) Formato aberto: formato de arquivo não proprietário, cuja especificação esteja
documentada publicamente e seja de livre conhecimento e implementação, livre de
patentes ou qualquer outra restrição legal quanto à sua utilização; e
d) Plano de Dados Abertos: documento orientador para as ações de implementação e
promoção de abertura de dados de cada órgão ou entidade da administração pública
federal, obedecidos os padrões mínimos de qualidade, de forma a facilitar o
entendimento e a reutilização das informações.
SURGIMENTO DO TERMO
“DADOS ABERTOS”
 Segundo Bittencourt,

O termo “Dados Abertos” surgiu em 1995 em um documento de uma agência científica


americana, abordando a divulgação de dados ambientais e geofísicos. No documento, os
autores promoveram um completo e aberto intercâmbio de informação científica entre diferentes
países como um pré-requisito para a análise e a compreensão de fenômenos naturais globais. É
importante frisar que o princípio de bens comuns aplicado ao conhecimento já foi teorizado por
Robert King Merton , em 1942, quando sua teoria mostrou os benefícios de dados científicos
abertos.
PILARES FUNDAMENTAIS
 A ideia dados abertos públicos (ou governamentais) tem como base o fato que os
dados governamentais são propriedades comuns (como as ideias científicas).
Essa filosofia de dados abertos públicos foi inspirada no conceito de código
aberto e tem como fundamentos três pilares: abertura, participação e
colaboração (Bittencourt).
O QUE SÃO DADOS ABERTOS
GOVERNAMENTAIS ?
Para o TCU,

Quando os dados são produzidos, coletados ou custodiados por autoridades públicas e


disponibilizados em formato aberto, considera-se que são dados abertos governamentais
AS TRÊS LEIS

 Não são leis no sentido literal, promulgadas por algum Estado. São, em suma, um conjunto
de testes para avaliar se um dado pode, de fato, ser considerado aberto.
 Foram propostas pelo especialista em políticas públicas, ativista dos dados abertos e
palestrante de políticas públicas na Harvard Kennedy School of Government David Eaves.
 As leis foram propostas para os dados abertos governamentais, mas pode-se dizer que elas se
aplicam aos dados abertos de forma geral.
AS TRÊS LEIS

• Se o dado não pode ser encontrado e indexado na Web, ele não existe;
• Se não estiver aberto e disponível em formato compreensível por máquina, ele não pode ser
reaproveitado;
• Se algum dispositivo legal não permitir sua replicação, ele não é útil.
DADOS NÃO INDEXADOS
 Deep web: são dados na internet, mas que não estão abertos para qualquer um achar. Não são
indexados por motores de busca (Google e Bing). Ex: o conteúdo do seu gmail.
 A dark web é a pontinha mais profunda e submersa no iceberg. A internet escura – onde a luz
não chega - reúne sites que, além de não serem indexados, só podem ser acessados por
navegadores específicos. (Ex: Tor)
8 PRINCÍPIOS
Completos
Todos os dados públicos são disponibilizados. Dados são informações
eletronicamente gravadas, incluindo, mas não se limitando a, documentos, bancos
de dados, transcrições e gravações audiovisuais. Dados públicos são dados que
não estão sujeitos a limitações válidas de privacidade, segurança ou controle de
acesso, reguladas por estatutos.
Todo o conjunto dos dados são tornados disponíveis e não somente uma
parte deles (TCU)
8 PRINCÍPIOS
Primários
Os dados são publicados na forma coletada na fonte, com a mais fina
granularidade possível, e não de forma agregada ou transformada. 

Um exemplo de dados primários se refere ao registro de um aluno do ensino


básico, enquanto que o grau de escolaridade de todos os alunos do ensino
básico em um determinado Estado é considerado um dado agregado​(TCU).
8 PRINCÍPIOS
Atuais / Estão Atualizados
Os dados são disponibilizados o quão rapidamente seja necessário para preservar
o seu valor.
Acessíveis
Os dados são disponibilizados para o público mais amplo possível e para os
propósitos mais variados possíveis.
Sendo assim, o dado aberto precisa ser disponibilizado em um local da
internet que seja facilmente acessível pelas pessoas​ (TCU)
8 PRINCÍPIOS
Processáveis por máquina

Os dados são razoavelmente estruturados para possibilitar o seu processamento


automatizado, de forma a possibilitar a análise de grandes quantidades de
registros sem intervenção manual.
8 PRINCÍPIOS
Acesso não discriminatório.

Os dados estão disponíveis a todos, sem que seja necessária identificação ou registro.

Não é necessária a identificação do interessado para acessá-los: os dados têm o


seu acesso de forma não discriminada, isto é, devem estar disponíveis a todos,
sem que seja necessário qualquer registro ou cadastro do interessado. (TCU)

O acesso anônimo aos dados deve ser permitido para dados públicos, incluindo
acesso por meio de proxies anônimos. Os dados não devem ser escondidos atrás de
"jardins murados". (opengovdata.org)
8 PRINCÍPIOS
Formatos não proprietários

Os dados estão disponíveis em um formato sobre o qual nenhum ente tenha


controle exclusivo.

A título de exemplo, dados disponibilizados em formato específico de um


software pago geralmente só são acessados por aquela ferramenta,
impossibilitando o acesso pelos interessados que não detêm a licença do
software. (TCU)
8 PRINCÍPIOS
Livre de licenças / “Licenças livres”
Os dados não estão sujeitos a restrições por regulações de direitos autorais,
marcas, patentes ou segredo industrial. Restrições razoáveis de privacidade,
segurança e controle de acesso podem ser permitidas na forma regulada por
estatutos.

Por exemplo, restrições de uso para fins comerciais excluem determinados


dados do conceito de “abertos​". (TCU)
8 PRINCÍPIOS
Segundo o TCU, um dado é considerado não aberto quando não possui uma das 8 características citadas
anteriormente.

Exemplos de dados não abertos: 

 Dados que não estão disponíveis na internet; 


 Dados que estão disponíveis na internet, porém em formatos proprietários, isto é, que necessitam de um
software específico para acessá-los; 
 Dados em disponíveis em Portable Document Format (PDF) ou em formato de imagem, que não são
facilmente processáveis por máquina; 
 Dados que, para serem acessados, requerem a identificação do interessado;
 Dados desatualizados; 
 Dados com restrições de licença, ou seja, que não podem ser livremente compartilhados (ex.: licenças que
não permitem o uso comercial dos dados)
5 MOTIVOS PARA ABERTURA
DOS DADOS
• Transparência na gestão pública;
• Contribuição da sociedade com serviços inovadores ao cidadão;
• Aprimoramento na qualidade dos dados governamentais;
• Viabilização de novos negócios;
• Obrigatoriedade por lei.
TRANSPARÊNCIA NA GESTÃO PÚBLICA

 A publicação dos dados governamentais em formato aberto permite que a sociedade


possa avaliar as ações e decisões de governo
 No Portal Brasileiro de Dados Abertos estão disponíveis para download em for-
mato aberto diversos conjuntos de dados de relevante interesse público, tais como
dados do orçamento federal; de convênios e contratos de repasse celebrados
com a União; de compras públicas do governo federal; do Produto Interno
Bruto (PIB); de prestação de contas das campanhas eleitorais, entre outros..
INICIATIVAS DE TRANSPARÊNCIA
 Política Aberta (http://www.politicaaberta.org) – aplicativo que usa dados provenientes do Portal
da Transparência e do Tribunal Superior Eleitoral para apresentar,
de um lado, a relação dos maiores doadores de campanha do ano de 2012 e, do
outro, a relação das empresas mais contratadas pelo Governo Federal do mesmo ano.
Com o clique sobre as informações da empresa ou doador, o usuário obtém o detalhamento dos
valores referentes às doações feitas e pagamentos recebidos, possibilitando ao cidadão o
exercício do controle social e do acompanhamento do processo eleitoral.
 QEdu (http://www.quedu.org.br) – portal aberto e gratuito com informações sobre
a qualidade do aprendizado dos alunos do 5º e 9º ano em cada escola, município e
estado do Brasil, permitindo que o cidadão acompanhe a evolução de determinadas
políticas públicas educacionais. O portal utiliza como fonte os dados da Prova
Brasil, do Censo Escolar e do Índice de Desenvolvimento da Educação Básica (Ideb)
INICIATIVAS DE TRANSPARÊNCIA
INICIATIVAS DE TRANSPARÊNCIA
 Where Does My Money Go (http://www.wheredoesmymoneygo.org) – sítio da
internet que tem por objetivo promover a transparência e engajamento do cidadão
por meio da análise e visualização de informações sobre gastos públicos do
Reino Unido. Apesar de não possibilitar um elevado nível de detalhamento das
despesas públicas, é possível saber, por exemplo, o valor gasto em segurança
pública (polícia, tribunais, prisões etc.) e em educação (primária, universidades,
pesquisa etc.), facilitando o controle social.
CONTRIBUIÇÃO DA SOCIEDADE COM SERVIÇOS
INOVADORES AO CIDADÃO

 A própria sociedade pode contribuir com serviços inovadores ao cidadão


 Saúde: Localizar hospitais próximos, comparar os hospitais públicos
 Educação: Comparar escolas
 Transporte: Informações em tempo real dos transportes públicos.
APRIMORAMENTO NA QUALIDADE DOS
DADOS GOVERNAMENTAIS

 Ao mesmo tempo que o gestor suspeita que há inconsistência ou desatualização


nas suas informações, sabe também que precisa sanear o problema, sob pena de
tomar decisões e executar ações equivocadas. Nesse contexto, a abertura dos dados
governamentais deve ser enxergada como uma oportunidade de menor custo para melhoria
desses dados, pois a própria sociedade pode identificar erros e apontar as devidas correções, o
que reduz o esforço da Administração na realização dessa tarefa.
 Exemplo: Cidadão, com GPS informa a localização de um escola, atualizando a base do
governo.
VIABILIZAÇÃO DE NOVOS NEGÓCIOS
 Quando dados de GPS foram disponibiliza dos abertamente para uso civil, foram
desenvolvidas inúmeras aplicações que vão desde sistemas de navegação até tipos específicos
de rede social, como o Foursquare (www.foursquare.com)
 Dados de previsão do tempo providos por serviços meteorológicos públicos também
possibilitam o desenvolvimento de novos negócios. Ex: Serviços de consultoria para
agricultores.
OBRIGATORIEDADE POR LEI
 Lei complementar 101/2000 (lei de responsabilidade fiscal – LRF), que, em seu capítulo IX, trata da transparência,
do controle e da fiscalização da gestão fiscal;
 Lei complementar 131/2009 (lei da transparência), que alterou a LRF a fim de determinar a disponibilização, em tempo
real, de informações pormenorizadas obre a execução orçamentária e financeira da União, dos Estados, do Distrito
Federal e dos Municípios
 Decreto s/n de 15 de setembro de 2011, que instituiu o plano de ação nacional por meio do qual o Brasil, como um dos
países que celebraram a Parceria para Governo Aberto (OGP)
 Lei 12.527/2011 (lei de acesso à informação), que dispõe sobre os procedimentos a serem observados pela
União, Estados, Distrito Federal e Municípios com o fim de garantir o acesso a informações previsto no inciso XXXIII
do art. 5 º, no inciso II do § 3º do art. 37 e no § 2º do art. 216 da Constituição Federal
 Instrução normativa SLTI/MP – 4/2012, que instituiu a Infraestrutura Nacional de Dados Abertos (Inda)

 Decreto 8.243/2014, que instituiu a Política Nacional de Participação Social – PNPS, com o objetivo de
fortalecer e articular os mecanismos e as instâncias democráticas de diálogo e a atuação conjunta entre a
Administração Pública Federal e a sociedade civil
INDA
 No Brasil, temos o portal dados.gov.br que disponibiliza dados governamentais
seguindo os princípios de dados abertos. Os dados abertos governamentais
fazem parte da política de acesso à informação do governo federal.
O QUE É A INDA ?
 A Infraestrutura Nacional de Dados Abertos (INDA) é um conjunto de padrões,
tecnologias, procedimentos e mecanismos de controle necessários para atender
às condições de disseminação e compartilhamento de dados e informações
públicas no modelo de Dados Abertos, em conformidade com o disposto na ePING.

 ePING
 A arquitetura ePING – Padrões de Interoperabilidade de Governo Eletrônico –
define um conjunto mínimo de premissas, políticas e especificações técnicas que
regulamentam a utilização da Tecnologia de Informação e Comunicação (TIC)
na interoperabilidade de serviços de Governo Eletrônico, estabelecendo as
condições de interação com os demais Poderes e esferas de governo e com a
sociedade em geral.
NORMAS FUNDAMENTAIS
Segundo Bittencourt, a definição do termo dados abertos carrega três normas
fundamentais (Open Knowledge Foundation, 2010):
a) Disponibilidade e acesso: os dados devem estar disponíveis como um todo e sob
custo não maior que um custo razoável de reprodução, e preferencialmente devem ser
possíveis de ser baixados pela Internet. Os dados devem também estar disponíveis de
uma forma conveniente e modificável.
b) Reuso e redistribuição: os dados devem ser fornecidos sob termos que permitam a
reutilização e a redistribuição, inclusive a combinação com outros conjuntos de dados.
c) Participação universal: todos devem ser capazes de usar, reutilizar e redistribuir –
não deve haver discriminação contra áreas de atuação ou contra pessoas ou grupos.
Por exemplo, restrições de uso “não comercial” que impediriam o uso “comercial”, ou
restrições de uso para certos fins (ex.: somente educativos) excluem determinados
dados do conceito de “abertos”
FORMATOS RECOMENDADOS
 Segundo o manual da Controladoria-Geral do Distrito Federal – CGDF,
 Para a publicação de dados abertos são recomendados os seguintes formatos
abertos:
 Dados em tabela: .CSV, .ODS
 Dados em texto: .ODT, .TXT
 Dados em texto formatado: .ODT
 Dados em imagens: .PNG
 Dados vetoriais: .ODG
 Dados georreferenciados: GML, ShapeFile, GeoTIFF.
PDF NÃO É CONSIDERADO
DADO ABERTO
 Segundo o manual da Controladoria-Geral do Distrito Federal – CGDF,
 Textos e tabelas disponibilizados em arquivos PDF dificilmente estão prontos para
serem (re)utilizados, necessitando passar por demorados processos de conferência e

adequação, muitas vezes manuais. Portanto, ainda que disponibilizados


gratuitamente na web, arquivos em PDF não configuram dados abertos
AS 5 ESTRELAS DOS DADOS
ABERTOS
 Tim Berners-Lee, o criador da World Wide Web (www), sugeriu um esquema de
diferentes graus de “intensidades” de abertura de dados, denominados “5 Estrelas
dos Dados Abertos”, que visam identificar o grau de ‘reusabilidade’ do dado
publicado, classificando grau ou intensidade de abertura.
 Somente são considerados dados abertos efetivos aqueles com, no mínimo, três
estrelas.
UMA E DUAS ESTRELAS

 Disponível na internet (web)
 Tanto faz o formato
 Sob uma licença aberta
 Ex: Um arquivo pdf

★★
 Disponível como dados estruturados legíveis por máquina
 Ex: Excel no lugar de uma imagem escaneada
TRÊS, QUATRO E CINCO
ESTRELAS
★★★
 Como o anterior, mas disponível em formato não proprietário.
 Ex: CSV no lugar de excel.

★★★★
 Como todos os anteriores, e ainda usando os padrões aberto do W3C (RDF e SAPRQL) para
identificar as coisas.
 Utilize URIs para identificar recursos. Isso vai ajudar as pessoas a apontarem para eles.

★★★★★
 Como todos os anteriores, e ainda referenciar (linkar) dados de outras pessoas para prover
contexto (dados linkados)
AS 5 ESTRELAS DOS DADOS
ABERTOS
O QUE É UM URI ?
 Uniform Resource Identifier (URI) é uma cadeia de caracteres compacta usada para identificar
ou denominar um recurso na Internet.
 Um URI pode ser classificado como um localizador (URL) ou um nome (URN), ou ainda
como ambos.
 Um URL é um URI que, além de identificar um recurso, provê meios de agir sobre obter e
representar este recurso, descrevendo o seu mecanismo de acesso primário ou a localização na
"rede". Por exemplo, o URL http://www.wikipedia.org/
 O URN define a identidade de um item, enquanto que o URL dá-nos um método para o
encontrar.
 Um URN típico é o sistema ISBN para identificar individualmente os livros. ISBN 0-486-
27557-4
DADOS LINKADOS
 O Linked Data surge de um conceito em ligar os dados e estruturá-los.
 Linked Open Data é a junção dos princípios do Linked Data com os
princípios do Open Data (dados abertos)
 Projeto Linked Open Data (LOD), que consiste em uma iniciativa para promover a publicação
de dados linkados (Linked Data)
HTTPS://
OPENDATABAROMETER.ORG
 Uma medida global de como os governos estão publicando e usando dados abertos para
responsabilidade, inovação e impacto social.

 A Leaders Edition analisa os 30 governos que adotaram a Carta de Dados Abertos (Open
Data Charter) e aqueles que, como membros do G20, se comprometeram com os Princípios
de Dados Abertos Anticorrupção do G20.
LETRAMENTO DOS DADOS
 À medida que a coleta e o compartilhamento de dados se tornam rotineiros e a
análise de dados e big data tornam-se ideias comuns nas notícias, negócios,
 governo e sociedade, torna-se cada vez mais importante para os alunos,
cidadãos e leitores terem algum letramento em dados.
 O letramento de dados é a capacidade de ler, compreender, criar e comunicar
dados como informação.
 A letramento em dados se distingue do letramento em estatística, pois envolve a
compreensão do que os dados significam, incluindo a capacidade de ler gráficos
e tabelas, bem como tirar conclusões dos dados. O letramento em estatística, por
outro lado, refere-se à "capacidade de ler e interpretar estatísticas resumidas na
mídia cotidiana", como gráficos, tabelas, declarações, pesquisas e estudos. 

Você também pode gostar