Escolar Documentos
Profissional Documentos
Cultura Documentos
ABERTOS
O QUE SÃO DADOS ABERTOS ?
Segundo Open Knowledge Internacional,
Dados são abertos quando qualquer pessoa pode livremente acessá-los, utilizá-los, modificá-
los e compartilhá-los para qualquer finalidade, estando sujeito a, no máximo, a exigências
que visem preservar sua proveniência e sua abertura.
O QUE SÃO DADOS ABERTOS ?
Segundo a Open Definition,
Dados abertos são dados que podem ser livremente utilizados, reutilizados e redistribuídos por
qualquer pessoa - sujeitos, no máximo, à exigência de atribuição à fonte original e
compartilhamento pelas mesmas licenças em que as informações foram apresentadas. Ou seja,
a abertura de dados está interessada em evitar um mecanismo de controle e restrições sobre os
dados que forem publicados, permitindo que tanto pessoas físicas quanto jurídicas possam
explorar estes dados de forma livre.
O QUE SÃO DADOS ABERTOS ?
Decreto 8.777,
Não são leis no sentido literal, promulgadas por algum Estado. São, em suma, um conjunto
de testes para avaliar se um dado pode, de fato, ser considerado aberto.
Foram propostas pelo especialista em políticas públicas, ativista dos dados abertos e
palestrante de políticas públicas na Harvard Kennedy School of Government David Eaves.
As leis foram propostas para os dados abertos governamentais, mas pode-se dizer que elas se
aplicam aos dados abertos de forma geral.
AS TRÊS LEIS
• Se o dado não pode ser encontrado e indexado na Web, ele não existe;
• Se não estiver aberto e disponível em formato compreensível por máquina, ele não pode ser
reaproveitado;
• Se algum dispositivo legal não permitir sua replicação, ele não é útil.
DADOS NÃO INDEXADOS
Deep web: são dados na internet, mas que não estão abertos para qualquer um achar. Não são
indexados por motores de busca (Google e Bing). Ex: o conteúdo do seu gmail.
A dark web é a pontinha mais profunda e submersa no iceberg. A internet escura – onde a luz
não chega - reúne sites que, além de não serem indexados, só podem ser acessados por
navegadores específicos. (Ex: Tor)
8 PRINCÍPIOS
Completos
Todos os dados públicos são disponibilizados. Dados são informações
eletronicamente gravadas, incluindo, mas não se limitando a, documentos, bancos
de dados, transcrições e gravações audiovisuais. Dados públicos são dados que
não estão sujeitos a limitações válidas de privacidade, segurança ou controle de
acesso, reguladas por estatutos.
Todo o conjunto dos dados são tornados disponíveis e não somente uma
parte deles (TCU)
8 PRINCÍPIOS
Primários
Os dados são publicados na forma coletada na fonte, com a mais fina
granularidade possível, e não de forma agregada ou transformada.
Os dados estão disponíveis a todos, sem que seja necessária identificação ou registro.
O acesso anônimo aos dados deve ser permitido para dados públicos, incluindo
acesso por meio de proxies anônimos. Os dados não devem ser escondidos atrás de
"jardins murados". (opengovdata.org)
8 PRINCÍPIOS
Formatos não proprietários
Decreto 8.243/2014, que instituiu a Política Nacional de Participação Social – PNPS, com o objetivo de
fortalecer e articular os mecanismos e as instâncias democráticas de diálogo e a atuação conjunta entre a
Administração Pública Federal e a sociedade civil
INDA
No Brasil, temos o portal dados.gov.br que disponibiliza dados governamentais
seguindo os princípios de dados abertos. Os dados abertos governamentais
fazem parte da política de acesso à informação do governo federal.
O QUE É A INDA ?
A Infraestrutura Nacional de Dados Abertos (INDA) é um conjunto de padrões,
tecnologias, procedimentos e mecanismos de controle necessários para atender
às condições de disseminação e compartilhamento de dados e informações
públicas no modelo de Dados Abertos, em conformidade com o disposto na ePING.
ePING
A arquitetura ePING – Padrões de Interoperabilidade de Governo Eletrônico –
define um conjunto mínimo de premissas, políticas e especificações técnicas que
regulamentam a utilização da Tecnologia de Informação e Comunicação (TIC)
na interoperabilidade de serviços de Governo Eletrônico, estabelecendo as
condições de interação com os demais Poderes e esferas de governo e com a
sociedade em geral.
NORMAS FUNDAMENTAIS
Segundo Bittencourt, a definição do termo dados abertos carrega três normas
fundamentais (Open Knowledge Foundation, 2010):
a) Disponibilidade e acesso: os dados devem estar disponíveis como um todo e sob
custo não maior que um custo razoável de reprodução, e preferencialmente devem ser
possíveis de ser baixados pela Internet. Os dados devem também estar disponíveis de
uma forma conveniente e modificável.
b) Reuso e redistribuição: os dados devem ser fornecidos sob termos que permitam a
reutilização e a redistribuição, inclusive a combinação com outros conjuntos de dados.
c) Participação universal: todos devem ser capazes de usar, reutilizar e redistribuir –
não deve haver discriminação contra áreas de atuação ou contra pessoas ou grupos.
Por exemplo, restrições de uso “não comercial” que impediriam o uso “comercial”, ou
restrições de uso para certos fins (ex.: somente educativos) excluem determinados
dados do conceito de “abertos”
FORMATOS RECOMENDADOS
Segundo o manual da Controladoria-Geral do Distrito Federal – CGDF,
Para a publicação de dados abertos são recomendados os seguintes formatos
abertos:
Dados em tabela: .CSV, .ODS
Dados em texto: .ODT, .TXT
Dados em texto formatado: .ODT
Dados em imagens: .PNG
Dados vetoriais: .ODG
Dados georreferenciados: GML, ShapeFile, GeoTIFF.
PDF NÃO É CONSIDERADO
DADO ABERTO
Segundo o manual da Controladoria-Geral do Distrito Federal – CGDF,
Textos e tabelas disponibilizados em arquivos PDF dificilmente estão prontos para
serem (re)utilizados, necessitando passar por demorados processos de conferência e
★★
Disponível como dados estruturados legíveis por máquina
Ex: Excel no lugar de uma imagem escaneada
TRÊS, QUATRO E CINCO
ESTRELAS
★★★
Como o anterior, mas disponível em formato não proprietário.
Ex: CSV no lugar de excel.
★★★★
Como todos os anteriores, e ainda usando os padrões aberto do W3C (RDF e SAPRQL) para
identificar as coisas.
Utilize URIs para identificar recursos. Isso vai ajudar as pessoas a apontarem para eles.
★★★★★
Como todos os anteriores, e ainda referenciar (linkar) dados de outras pessoas para prover
contexto (dados linkados)
AS 5 ESTRELAS DOS DADOS
ABERTOS
O QUE É UM URI ?
Uniform Resource Identifier (URI) é uma cadeia de caracteres compacta usada para identificar
ou denominar um recurso na Internet.
Um URI pode ser classificado como um localizador (URL) ou um nome (URN), ou ainda
como ambos.
Um URL é um URI que, além de identificar um recurso, provê meios de agir sobre obter e
representar este recurso, descrevendo o seu mecanismo de acesso primário ou a localização na
"rede". Por exemplo, o URL http://www.wikipedia.org/
O URN define a identidade de um item, enquanto que o URL dá-nos um método para o
encontrar.
Um URN típico é o sistema ISBN para identificar individualmente os livros. ISBN 0-486-
27557-4
DADOS LINKADOS
O Linked Data surge de um conceito em ligar os dados e estruturá-los.
Linked Open Data é a junção dos princípios do Linked Data com os
princípios do Open Data (dados abertos)
Projeto Linked Open Data (LOD), que consiste em uma iniciativa para promover a publicação
de dados linkados (Linked Data)
HTTPS://
OPENDATABAROMETER.ORG
Uma medida global de como os governos estão publicando e usando dados abertos para
responsabilidade, inovação e impacto social.
A Leaders Edition analisa os 30 governos que adotaram a Carta de Dados Abertos (Open
Data Charter) e aqueles que, como membros do G20, se comprometeram com os Princípios
de Dados Abertos Anticorrupção do G20.
LETRAMENTO DOS DADOS
À medida que a coleta e o compartilhamento de dados se tornam rotineiros e a
análise de dados e big data tornam-se ideias comuns nas notícias, negócios,
governo e sociedade, torna-se cada vez mais importante para os alunos,
cidadãos e leitores terem algum letramento em dados.
O letramento de dados é a capacidade de ler, compreender, criar e comunicar
dados como informação.
A letramento em dados se distingue do letramento em estatística, pois envolve a
compreensão do que os dados significam, incluindo a capacidade de ler gráficos
e tabelas, bem como tirar conclusões dos dados. O letramento em estatística, por
outro lado, refere-se à "capacidade de ler e interpretar estatísticas resumidas na
mídia cotidiana", como gráficos, tabelas, declarações, pesquisas e estudos.