Você está na página 1de 21

Impedimentos sócio-técnicos de dados abertos

Anneke Zuiderwijk 1,2 , Marijn Janssen 1 , Sunil Choenni 2,3 , Ronald Meijer 2 e


Roexsana Sheikh Alibaks 

Resumo : Há uma demanda crescente para a abertura de dados fornecidos por organizações públicas e privadas. Vários
as organizações já começaram a publicar seus dados e, potencialmente, há muitos benefícios a serem ganhos. Contudo,
perceber os efeitos positivos pretendidos e criar valor com o uso de dados abertos em grande escala é mais fácil de dizer
do que feito. A abertura e o uso de dados encontram numerosos impedimentos que podem ter um sócio e um
natureza técnica. No entanto, nenhuma visão geral dos impedimentos está disponível da perspectiva do usuário de dados
abertos.
Os impedimentos sociotécnicos para o uso de dados abertos foram identificados com base em uma visão geral da literatura,
quatro
workshops e seis entrevistas. Uma análise desses 118 impedimentos mostra que as políticas de dados abertos fornecem
atenção à perspectiva do usuário, sendo os usuários quem geram valor a partir dos dados abertos. Os impedimentos
que o processo de dados abertos encontra atualmente foram analisados e categorizados em dez categorias: 1) disponibilidade
e acesso, 2) encontrar capacidade, 3) usabilidade, 4) compreender capacidade, 5) qualidade, 6) vincular e combinar dados, 7)
comparabilidade e compatibilidade, 8) metadados, 9) interação com o provedor de dados e 10) abertura e
Enviando. Os impedimentos encontrados na literatura diferem dos impedimentos encontrados na pesquisa empírica.
Nossa visão geral dos impedimentos derivados da literatura e da pesquisa empírica é, portanto, mais
abrangente do que já estava disponível. A visão abrangente dos impedimentos pode ser usada como um
base para melhorar o processo de dados abertos, e pode ser estendido em pesquisas futuras. Isso resultará na resolução
de alguns impedimentos e novos impedimentos podem aumentar com o tempo.
Palavras - chave : dados abertos, dados governamentais abertos, impedimentos, barreiras, desafios, problemas, perspectiva
do usuário.

1. Introdução
Recentemente, os dados abertos estão ganhando importância no contexto de uma demanda crescente por abertura de
público
e organizações privadas. Por exemplo, a administração Obama e a Comissão Europeia
cada vez mais apelo por abertura (Obama, 2009 , European_Commission, 2003). Público e privado
as organizações estão sob pressão crescente para divulgar seus dados a uma variedade de usuários, incluindo
investigadores, cidadãos, empresas e funcionários públicos. Organizações em países de todo o mundo
já começaram a publicar seus dados e vários exemplos de sua utilização já são conhecidos. Pra
por exemplo, na Holanda, um aplicativo foi desenvolvido mostrando fotos históricas, filmes e outros
informações durante um passeio pela cidade, com base na localização geográfica do usuário
(http://www.appsvoornederland.nl/apps/vistory-the-interactive-historical-video- app). Outro exemplo
vem da Care Quality Commission do Reino Unido, que publica taxas de sobrevivência
após a cirurgia cardíaca, com o objetivo de ajudar as pessoas que precisam de cirurgia cardíaca a fazer escolhas
informadas sobre deles Cuidado e
tratamento para melhorar
a
qualidade
de
cuidados de saúde
(http://heartsurgery.cqc.org.uk/survival.aspx) .
O valor potencial dos dados abertos é enorme e espera-se que resulte em aplicativos e
práticas que atualmente não temos conhecimento (Dekkers et al., 2006 , European_Commission, 2011b).
No entanto, o processo em que os dados são publicados, encontrados, usados, vinculados, reutilizados e discutidos,
que
é aqui referido como o processo de dados abertos, parece encontrar muitos impedimentos sociotécnicos.
Impedimentos são aqueles fatores que dificultam ou bloqueiam o uso de dados abertos. Sócio técnico
impedimentos dizem respeito aos humanos e à tecnologia. De acordo com Bostrom e Heinen, “o técnico
sistema está preocupado com os processos, tarefas e tecnologia necessária para transformar entradas em saídas ”
Considerando que “o sistema social está preocupado com os atributos das pessoas (por exemplo, atitudes,
habilidades, valores),
as relações entre as pessoas, sistemas de recompensa e estruturas de autoridade ”. O técnico e social
presume-se que os sistemas interagem (Bostrom e Heinen, 1977a , Bostrom e Heinen, 1977b).
O processo de dados abertos implica que os dados abertos não devem ser vistos apenas como um produto, mas como
um
processo em andamento (Janssen e Zuiderwijk, 2012 ), pois novos aplicativos e o uso de dados abertos podem
resulta em novos insights que podem resultar em novas maneiras de usar dados abertos. No processo de dados
abertos,
organizações públicas abrem seus dados que podem ser usados por cidadãos, empresas, pesquisadores, civis
servidores e outros tipos de usuários. De um alto nível, o processo de dados abertos pode ser dividido em cinco
etapas básicas. Primeiro, as organizações governamentais produzem, coletam e integram grandes quantidades de
dados para
ser capaz de cumprir suas tarefas (ver caixa 1 na Figura 1). A produção desses dados é financiada pelo público
dinheiro. Em segundo lugar, os órgãos públicos decidem se irão abrir, ou seja, publicar, seus dados (ver caixa 2). Esta
pode estar no próprio site, em um portal nacional ou em qualquer outra plataforma, como a plataforma Engage
(www.engage-data.eu). De acordo com a Comissão Europeia, os dados de abertura devem ser realizados até
disponibilizando todos os tipos de dados não sensíveis à privacidade na Internet (European_Commission,
2011a) . Os dados governamentais publicados são então chamados de dados abertos . Dados abertos que são
encontrados por potenciais usuários de dados abertos (ver caixa 3) “podem ser usados, reutilizados e redistribuídos
por todos,
sem restrições de direitos autorais, patentes ou outros mecanismos de controle ” (LinkedGov, 2011 ,
Open_Knowledge_Foundation, 2011, Sweeney, 2009) (ver caixa 4).
Uma possibilidade de reutilizar dados governamentais abertos é vinculá-los a outros dados, para que as relações
com outros dados podem ser mostrados ( Berners-Lee, 2009) . Os dados vinculados que são o resultado deste
ligando
estamos
definiram
como
"uma
coleção
de
inter-relacionado
conjuntos de dados
sobre
a
Rede"
(World_Wide_Web_Consortium, 2011, http://www.w3.org/standards/semanticweb/data). Dados que são
ambos abertos e vinculados, chamados de Linked Open Data (LOD), são dados que atendem aos requisitos de
dados abertos e que mostram relações entre os dados abertos também. Dados governamentais abertos obtidos
mais valor quando estão vinculados em comparação com dados governamentais abertos que não estão vinculados
( Berners-
Lee, 2009). Além disso, no processo de dados abertos ideal, informações de feedback sobre o uso dos dados
é fornecido aos órgãos públicos que produziram os dados (ver caixa 5), para que esses dados possam ser usados para
melhorar os processos de trabalho, como processos de formulação de políticas de órgãos públicos (Janssen e
Zuiderwijk,
2012) .

 O processo de dados abertos será usado para identificar impedimentos.

Figura 1: Representação de alto nível do processo de dados abertos, incluindo ambos (governamental)
organizações) e usuários
Apesar de sua importância, nenhuma visão abrangente dos impedimentos sociotécnicos dos dados abertos
processo está disponível a partir da perspectiva do usuário de dados abertos. Muitos estudos investigaram
impedimentos sociotécnicos que estão relacionados à perspectiva do provedor dos dados (para
exemplo, Huijboom e Broek, 2011, Zhang et al., 2005, Conradie e Choenni, 2012, Meijer e
Thaens, 2009, Janssen et al., 2012, Zuiderwijk et al., 2012b), considerando os impedimentos que os usuários de
experiências de dados abertos são frequentemente negligenciadas (Blakemore e Craglia, 2006, Janssen et al., 2012).
A criação de uma visão geral dos impedimentos sociotécnicos é relevante, como uma ampla visão geral de
esses impedimentos do processo de dados abertos podem fornecer conhecimento prático sobre quais
5. Discutindo e
fornecendo feedback sobre
dados abertos (vinculados)
2. Dados de abertura
3. Encontrar dados abertos
4. Usando dados abertos (por exemplo
curadoria, anotação,
aprimoramento, processamento,
visualizando, vinculando)
1. Criação de dados (por exemplo
produzindo, coletando,
armazenar e pagar por
dados)
(Governamental)
organizações
Comercial

impedimentos existem atualmente e quais desafios devem ser enfrentados por políticas de dados abertos e
estratégias.
Este artigo tem como objetivo fornecer uma ampla visão geral dos impedimentos sociotécnicos dos dados abertos
processo da perspectiva do usuário, analisando os resultados de uma visão geral da literatura, entrevistas e
workshops. Na seção seguinte, a abordagem da pesquisa será apresentada. Posteriormente, nós
descrever um pano de fundo para a identificação de impedimentos com base em políticas de dados abertos e o
impedimentos que encontramos na literatura. Isso é seguido por uma visão geral e discussão de
impedimentos técnicos, incluindo tabelas com impedimentos categorizados e discussões da fonte
diferenças, possíveis explicações para essas diferenças e limitações desta pesquisa. Nós concluimos
o artigo com as principais conclusões desta pesquisa de impedimento.
Partes deste artigo foram publicadas nas atas da 12ª Conferência Europeia sobre
eGovernment (ECEG) ( Zuiderwijk et al., 2012a) .

2 Abordagem de pesquisa

O objetivo deste artigo é criar uma visão abrangente dos vários tipos de sociotécnica
impedimentos. Essa lista pode ser usada para melhorar infraestruturas de dados abertos, políticas e estratégias.
O processo de dados abertos pode ser melhorado e efeitos positivos podem ser obtidos. Optamos por usar
várias fontes, visto que se espera que forneça uma visão geral mais abrangente dos impedimentos do que
uma única fonte. Começamos criando uma visão geral da literatura, que resultou na identificação de
categorias de impedimento inicial e nossa lista inicial de impedimentos. Posteriormente, a pesquisa empírica foi
conduzida através da organização de quatro workshops e seis entrevistas, uma vez que essas fontes poderiam ser
usadas para alcançar
diferentes tipos de usuários de dados abertos, incluindo pesquisadores, funcionários públicos, desenvolvedores,
jornalistas e
empresas.

2.1 Visão geral da literatura

A visão geral da literatura é criada pesquisando artigos de periódicos, artigos de conferências, livros,
relatórios governamentais e não governamentais e outras informações em vários bancos de dados, incluindo
Science Direct, Scopus, TU Delft Repository, Google Scholar e Google. Palavras-chave que foram usadas
durante esta pesquisa foram combinações dos termos dados abertos, dados do governo aberto, link aberto
dados, Informação do Setor Público (PSI), uso de dados abertos, impedimento de dados abertos, barreira de dados
abertos, aberto
problema de dados, restrição de dados abertos e desafio de dados abertos. No total, aproximadamente 1.555.000
documentos foram encontrados na base de dados Science Direct, 552.000 no Scopus, 7.000 na TU Delft
Repositório, 2.000.000 no Google Scholar e 211.000.000 no Google. Pode haver uma sobreposição
entre esses documentos. Os documentos foram filtrados em busca de impedimentos, barreiras,
problemas e desafios para o uso de dados abertos. A maioria dos documentos obtidos parecia não
ser útil, pois não descreveu nenhum impedimento para o processo de abertura de dados. No total, 37
foram selecionadas publicações relevantes e, a partir delas, uma visão geral dos impedimentos para o
uso de dados abertos foi criado. A relevância dos resultados foi determinada pelas máquinas de pesquisa e
escaneando os títulos e resumos dos documentos.

2.2 Entrevistas

Para obter uma melhor compreensão dos impedimentos que foram descritos na literatura e obter mais
informações detalhadas, entrevistas semiestruturadas com especialistas foram realizadas com seis pessoas-chave que
trabalhou com dados abertos e / ou trabalhou frequentemente com pessoas que trabalharam com dados abertos. Os
entrevistados
trabalhou principalmente nas disciplinas de ciências sociais e humanas, pois não havia infraestruturas de dados
abertos suficientes
existem nestas disciplinas e, por esta razão, espera-se que os impedimentos sejam experimentados por estes
entrevistados. A decisão de entrevistar essas seis pessoas foi baseada em sua experiência com o uso
de dados abertos, sua reputação e posição reconhecidas e respeitáveis, seu histórico de
produção de publicações, seu histórico de participação em conferências e seu alcance além do estrito
e comunidades especializadas. Finalmente, a decisão de entrevistar essas seis pessoas foi baseada em seus
disposição em participar desta pesquisa. Todas as entrevistas foram realizadas em dezembro de 2011 e
Janeiro de 2012. Durante as entrevistas, os entrevistados foram questionados sobre quais tipos de dados abertos e
metadados que eles usaram, de que forma, quais impedimentos eles notaram durante o uso de dados abertos e
metadados, quais desafios existiam para o uso de dados abertos e metadados e quais os seus
os requisitos e necessidades eram para dados e metadados abertos.

Todas as entrevistas foram transcritas. Após a realização das entrevistas, os entrevistados foram questionados se
uma transcrição da entrevista pode ser enviada para aprovação. Todos os entrevistados concordaram com isso e
todas as transcrições foram enviadas aos entrevistados em poucos dias. Os entrevistados foram convidados a
fornecer comentários sobre a transcrição dentro de duas semanas, caso eles não concordem (totalmente) com ela,
então
que a transcrição pode ser assimilada.

2.3 Workshops

Para ampliar nosso conhecimento sobre quais impedimentos sociotécnicos atualmente influenciam o aberto
processo de dados, realizamos quatro workshops em eventos internacionais. As oficinas voltadas para
envolvendo uma composição diversa de usuários de dados abertos, como se espera que diferentes usuários
mencionem
impedimentos diferentes. Além disso, vários workshops foram realizados em vários países para que um
grande número de pessoas com diferentes nacionalidades seria alcançado, o que diminui o risco em
conclusões inválidas ou específicas do país. A Tabela 1 mostra as oficinas que foram organizadas.
Embora várias ideias sobre os impedimentos do uso de dados abertos tenham sido discutidas pelo
organizadores dessas oficinas, apenas aqueles impedimentos que foram confirmados pelos participantes são
descrito neste artigo.

3 Antecedentes da literatura

Nesta seção, descrevemos várias políticas de dados abertos, que resultaram em impedimentos para o
processo de dados aberto. Por fim, são apresentados os impedimentos encontrados na literatura.

3.1 Políticas de dados abertos

Os impedimentos do processo de dados abertos podem ser tratados desenvolvendo boas políticas de dados abertos. A
importante política de dados abertos é a Diretiva de Informação do Setor Público (PSI) da UE, na qual um
foi apresentado o quadro legislativo que regulamenta a disponibilização de dados de órgãos do setor público para
reutilização (European_Commission, 2003). Neste relatório, a Comissão Europeia (CE) argumentou que um
quadro geral “é necessário para garantir condições justas, proporcionais e não discriminatórias

Conferência e título do workshop


Localização
e data
Número e tipo
de participantes
Mira)

1) Conferência Internacional para E-


Democracia e Governo Aberto
(CeDEM12), “Open Linked
dados governamentais para cidadão
engajamento - Um workshop sobre o
benefícios e restrições do link aberto
dados governamentais e o papel de
metadados no engajamento dos cidadãos ”(90
minutos).
Danúbio
Universidade
de Krems,
Krems an
der Donau,
Áustria.
Maio
4,
2012
17. Principalmente civil
servos (federal
governo e
municípios),
acadêmico
pesquisadores,
alunos.

O objetivo era obter uma visão da forma como os dados abertos são usados
e reutilizado atualmente, incluindo os benefícios e impedimentos
que são típicos para dados governamentais abertos atualmente disponíveis.
Em relação aos benefícios e impedimentos, em particular o papel do
metadados foram discutidos durante este workshop.

2) Conferência Internacional Anual


em pesquisa governamental digital

(DG.O2012), “Linking open data -


Desafios e soluções ”(meio dia)
Robert H.
Smith
Escola de
Busines,
Universidade
de
Maryland,
EUA. Junho
4, 2012
26 (após o
pausa 22). Principalmente
pesquisadores
(universidades,
governo, outro
pesquisa
organizações).
Os organizadores apresentaram uma visão geral dos desenvolvimentos
recentes em
o campo de dados governamentais abertos e exemplos do uso de
estes dados. Além disso, os principais objetivos e o status atual do
foram apresentados o projeto ENGAGE, que visa desenvolver um
infra-estrutura de provisão e uso de dados governamentais abertos.
Posteriormente, os participantes foram convidados a preencher o ENGAGE
questionário, que visava descobrir as necessidades de (potencial)
usuários de dados abertos do setor público.

3) Samos 2012 Summit on Open


Dados para governança, indústria e
Society (Samos Summit), “Open
Requisitos de dados ”(90 minutos)
Universidade
de
a
Egeu em
Samos,
Grécia.
julho
3,
2012
16
Principalmente
alunos,
acadêmico
pesquisadores.
O objetivo era trocar conhecimentos e ideias sobre o status
de dados abertos, seus benefícios e desafios e requisitos do usuário.
Os participantes foram convidados a preencher um questionário sobre
requisitos de uso de dados abertos, para escrever em post-its os três
requisitos que eram mais importantes de acordo com eles e para
discutir impedimentos, ideias e experiências subjacentes. Finalmente,
os organizadores do workshop apresentaram os resultados provisórios do
questionário e apresentou várias proposições, que
forneceu a base para uma discussão interativa entre todos
participantes.
4) Federação Internacional para
Processamento de Informação - Eletrônico
Conferência do Governo (IFIP EGOV
2012), “Um workshop sobre o uso
dados do setor público: The ENGAGE
projeto ”(meio dia)
Universidade
de Agder,
Kristiansan
d, Noruega.
setembro
3, 2012
12 (após o
quebrar 10). Principalmente
pesquisadores
(universidades), civil
funcionários,
empresas.
O objetivo era trocar informações sobre o status de aberto
dados, seus benefícios e desafios e requisitos do usuário.
Os participantes foram convidados a preencher um questionário sobre
requisitos de uso de dados abertos. Os resultados do questionário provisório
foram apresentados e discutidos com os participantes.
para a reutilização de [PSI] ”(p. 1) e que“ PSI é um importante material primário para produtos de conteúdo digital
e serviços ”(p. 1). Após o lançamento da diretiva PSI, muitas diretivas e implementação
diretrizes seguidas. Em 2006, a CE desenvolveu uma política para a reutilização de suas próprias fontes de
informação
que inclui a declaração de que todos os dados gerais acessíveis da CE devem estar disponíveis para
todos, geralmente de graça (European_Commission, 2011a) . Em 2009, a administração Obama afirmou
que o objetivo principal era o estabelecimento de um nível sem precedentes de abertura do Governo
(Obama, 2009) . A administração Obama publicou uma Diretiva de Governo Aberto alguns meses
depois (The_White_House, 2009). Com base nas políticas anteriores, a CE apresentou um
Estratégia de dados para a Europa, em que regras mais evidentes sobre como fazer o melhor uso de recursos públicos
são apresentadas informações (European_Commission, 2011b) .
Uma mudança importante da Estratégia de Dados Abertos de 2011 em comparação com as diretrizes e diretrizes que
foram divulgados pela CE antes, é que foi feita "uma regra geral que todos os documentos que são feitos
acessíveis por órgãos do setor público podem ser reutilizados para qualquer finalidade, comercial ou não comercial,
a menos que protegido por direitos autorais de terceiros ”(p. 1) e que“ os órgãos públicos não devem ser autorizados a
cobrar mais do que os custos disparados pela solicitação individual de dados (custos marginais) ”(p. 1). A CE
vai liderar pelo exemplo; abrirá seus dados gratuitamente por meio de um novo portal de
dados (European_Commission,
2011b) .
Em maio de 2012, a administração Obama publicou a Estratégia de Governo Digital, que visa 1)
capacitar o povo americano a acessar informações e serviços governamentais digitais de alta qualidade
em qualquer lugar, a qualquer hora, em qualquer dispositivo; 2) garantir que, à medida que o governo se ajusta a este
novo mundo digital,
aproveitamos a oportunidade de adquirir e gerenciar dispositivos, aplicativos e dados de forma inteligente, segura e
formas acessíveis; e 3) desbloquear o poder dos dados do governo para estimular a inovação e melhorar o
qualidade dos serviços para o povo americano (Obama, 2012 ).
Apesar da atenção considerável que tem sido dada às políticas de dados abertos, as políticas mal pagam
atenção para superar os impedimentos do uso de dados abertos. A maioria das políticas de dados abertos são
focado internamente e quase não prestam atenção aos possíveis usuários que são necessários para gerar o
impacto pretendido das políticas (Zuiderwijk e Janssen, no prelo) .

3.2 Impedimentos encontrados na literatura

Embora o movimento de dados abertos seja guiado por diretrizes, estratégias e políticas nacionais do PSI,
as políticas de dados são acompanhadas por muitos impedimentos. Pesquisas anteriores mostraram que existem
pelo menos três categorias principais de impedimentos das políticas atuais de dados abertos da perspectiva do
do utilizador. Em primeiro lugar, existem impedimentos de acesso aos dados, que estão relacionados à criação,
abertura, localização e
obtenção dos dados (caixa 1, 2 e 3 da Figura 1). Em segundo lugar, os impedimentos de uso de dados restringem
diretamente o uso
de dados abertos (caixa 4 na Figura 1). Terceiro, impedimentos de depósito de dados tornam difícil armazenar,
discutir e
fornecer feedback sobre conjuntos de dados (caixa 5 na Figura 1). Os principais impedimentos das atuais políticas de
dados abertos
são mostrados na Tabela 1.
Tabela 1: Impedimentos derivados da literatura.
1) Impedimento de acesso a dados
Descrição
Literatura
Obter acesso aos dados é difícil.
(Boulton et al., 2011 , McLaren
e Waters, 2011 ,
European_Commission, 2011b )
PSI é publicado em várias fontes fragmentadas, o que torna
é difícil encontrá-los.
(Vickery e Wunsch-Vincent,
2006 )
As informações de PSI são depositadas em várias fontes fragmentadas, então
que os usuários têm dificuldade em encontrar os dados.
(FP7-ENGAGE, 2011 )
Uma grande barreira é o acesso a uma rede adequada e apropriada
conjuntos de dados.
(Conradie e Choenni, 2012 ,
Janssen et al., 2012 )
Os dados estão temporariamente indisponíveis no site
(Veljković et al., 2011 )
Os dados estão apenas parcialmente disponíveis; informação incompleta
(DataCite, 2011, Janssen et al.,
2012 )
Sem acesso aos dados originais, apenas dados processados. Esconder aplicativos
a complexidade, mas também o potencial do uso de dados abertos
(Janssen et al., 2012)

Descrição
Literatura
Muitos sites PSI requerem ação do ponto de vista do
usuário, por exemplo, registro, adesão, preenchimento de um formulário,
obter permissão por escrito ou uma taxa
(Blakemore e Craglia, 2006 ,
Meijer e Thaens, 2009 ,
Murray-Rust, 2008, Janssen et
al., 2012 ).
O acesso aos dados é restrito a um grupo de usuários
(DataCite, 2011 )
Os usuários podem ter que aceitar uma variedade de acordos de uso antes
eles podem obter acesso aos dados originais. Não tem uniforme
conjunto de termos de licenciamento para sua reutilização
(DataCite, 2011 , Judge, 2010,
Vickery e Wunsch-Vincent,
2006, Janssen et al., 2012)
Persistem diferenças significativas nas regras e práticas nacionais.
Isso leva à fragmentação do mercado interno de informação
e impede a criação de serviços de informação transfronteiriços
(European_Commission, 2011a )
Os conjuntos de dados são fragmentados e oferecidos em vários sites,
que em alguns casos são difíceis de encontrar acesso a conjuntos de dados estão em
alguns casos restritos a grupos de usuários específicos. Não é n o
portal central ou arquitetura
(Conradie e Choenni, 2012 ,
Janssen et al., 2012 )
Dificuldade em pesquisar e navegar devido a nenhum índice ou outro
significa garantir uma busca fácil para encontrar os dados certos
(Janssen et al., 2012 )
A receita de várias organizações governamentais é baseada em
a venda de dados, o que os torna relutantes em publicar o
dados
(Huijboom e Broek, 2011 )
Os cientistas geralmente veem os dados publicados como pertencentes ao
comunidade científica, mas muitos editores reivindicam direitos autorais sobre
dados e não permitirá sua reutilização sem permissão.
(Murray-Rust, 2008 )
Muitos conjuntos de dados de propriedade pública habilitados para localização não foram
fácil de acessar e montar no local e central
órgãos governamentais
(McLaren e Waters, 2011 )
A noção de acesso é contestada e é o resultado de um
processo político. Existe um conjunto de tensões características que
tornam muito difícil para as partes envolvidas (produtores,
corretores intermediários, usuários de informações e cidadãos) para encontrar
um terreno comum eficaz em um debate que deve se concentrar em
construindo os "bens comuns da informação".
(Blakemore e Craglia, 2006 )
As administrações normalmente expressam relutância em tornar seus dados
e metadados (informações sobre os dados) disponíveis, para
vários aspectos culturais, políticos, jurídicos, institucionais e técnicos
razões. Eles mantêm dados e metadados dentro de seu legado
sistemas, cercados e isolados
(European_Commission, 2011c )
O usuário potencial não pode obter acesso aos dados, por exemplo
por causa da sobrecarga administrativa, usuário diferente
registros, termos de acesso e outras barreiras
(FP7-ENGAGE, 2011 )
Os dados são mantidos a portas fechadas ou paredes de pagamento que exigem
que as pessoas comprem quais informações estão disponíveis
(Vogel, 2011 )
Há falta de informação de que certos dados realmente existem
e está disponível
(European_Commission, 2011b )
Existe uma falta de clareza de qual autoridade pública detém o
dados
(European_Commission, 2011b )
Existe o perigo de órgãos do setor público abusarem de seus
poder de monopólio como o único produtor de um tipo particular de
dados para cobrar preços excessivos
(Janssen, 2011 )
Os legisladores podem ter feito contratos rígidos de limitação de acesso
com vários fornecedores comerciais, de modo que os dados não podem ser
acessado por partes interessadas externas.
(Napoli e Karaganis, 2010 )
Pode haver barreiras práticas, como dificuldades em obter
acesso aos dados (por exemplo, atrasos indevidos).
(Viglione et al., 2010 )
Acordos de reutilização exclusiva com um ator comercial ou
uso restrito a uma empresa estatal
(European_Commission, 2011b )
Nem todos os países do mundo adotaram dados abertos nacionais
políticas.
(Schellong e Stepanets, 2011 ,
Zuiderwijk e Janssen, 2012 )
Nenhuma pesquisa sobre as necessidades dos usuários de dados.
(Zuiderwijk e Janssen, 2012)

Muita informação para processar e não tenho certeza do que olhar


e muitas iniciativas de dados
(Janssen et al., 2012)
2) Impedimentos de uso de dados
Descrição
Literatura
Não há metadados comumente aceitos.
(European_Commission, 2011a )
Não há metadados suficientes disponíveis (especialmente contextuais
metadados), de modo que nenhuma decisão possa ser tomada sobre a qualidade
dos dados e a maneira como foram coletados e medidos
(Xiong et al., 2011 , Hernández-
Pérez et al., 2009 , Schuurman
et al., 2008, Zuiderwijk et al.,
2012c )
O uso adequado de conjuntos de dados é dificultado uma vez que os metadados com
em relação aos conjuntos de dados são mal documentados e, portanto, o
a semântica dos dados pode ser ambígua
(Conradie e Choenni, 2012 )
Existem preocupações com a confiabilidade da fonte, dados
proveniência e aspectos legais do consumo de dados
(O'Riain et al., 2012 )
Sem explicação do significado dos dados
(Janssen et al., 2012 )
É difícil medir a qualidade dos dados de resultados combinados (Smith, 2011 )
Como determinar a qualidade de um conjunto de dados é uma questão em aberto
(Conradie e Choenni, 2012 ,
Janssen et al., 2012 )
Qualidade limitada de dados. Vários países sugeriram que o
a qualidade de alguns dados do governo é muito limitada para permitir a sua
publicação
(Huijboom e Broek, 2011 )
A qualidade da informação não é garantida automaticamente, e
insight é necessário antes que a informação possa ser usada para
certos propósitos.
(Janssen et al., 2012)
É necessário identificar os recursos que manterão o
qualidade do PSI
(Blakemore e Craglia, 2006 )
A qualidade das ontologias pode não ser muito alta
(Klerk, 2011 )
Falta de precisão das informações
(Janssen et al., 2012)
Os usuários podem não ter conhecimento do domínio, o que torna difícil
comparar, vincular e reutilizar dados. Isso também dá problemas em
caso os usuários sejam forçados a empregar vários dados arbitrários
transformações para tornar os dados utilizáveis e comparáveis
(FP7-ENGAGE, 2011, King et
al., 2011 , Janssen et al., 2012).
Um assunto subestimado parece ser a disponibilidade de todos
tipos de recursos e níveis de conhecimento dos usuários para usar
dados complexos e mais sofisticados (falta do necessário
capacidade de usar as informações)
(Janssen et al., 2012)
Muito do esforço atual está focado em como usar dados facilmente
incorporado em aplicativos de software, enquanto vincular e
combinar dados por usuários requer conhecimento sofisticado
(Janssen et al., 2012)
Técnicas estatísticas são frequentemente usadas para a coleção,
análise, interpretação e apresentação dos dados. Ainda estatístico
o conhecimento é escasso.
(Janssen et al., 2012)
Definições de dados conflitantes são os principais obstáculos
(Zhang et al., 2005 )
As informações não estão disponíveis em um formato legível por máquina
(European_Commission, 2011a )
Os usuários muitas vezes precisam converter PSI em um formato que o torna
possível reutilizar os dados e compará-los com outros dados
(FP7-ENGAGE, 2011, Janssen
et al., 2012 )
A falta de padrões de dados abertos entre (níveis) de governo
organizações foram identificadas como uma barreira para abrir dados
uso por cidadãos e empresas e, posteriormente, novos
política de dados
(Huijboom e Broek, 2011 ,
Janssen et al., 2012 )
Nenhuma política uniforme para publicação de dados
(Janssen et al., 2012)
Pouca atenção foi dada a sistemas sistemáticos e estruturados
pesquisa sobre as diferenças entre as políticas de dados abertos.
(Zuiderwijk e Janssen, 2012 )
Barreiras de idioma e aspectos de interoperabilidade precisam ser
abordado para que os recursos de informação de diferentes
organizações e países podem ser combinados
(European_Commission, 2011a )
Os dados não podem ser facilmente analisados em diferentes organizações. (McLaren e Waters, 2011) .

Muitos conjuntos de dados de propriedade pública habilitados para localização não foram
fácil de analisar em órgãos do governo local e central.
McLaren e Waters 2011 )
O foco do debate PSI está centrado em uma agenda
articulado principalmente por meio do poder dos produtores PSI,
e menos nas necessidades do cidadão / consumidor
(Blakemore e Craglia, 2006 )
Os usuários de dados acham difícil interpretar os dados, porque eles
não estão familiarizados com as definições e categorias que são usadas para
apresentar os dados. Portanto, é difícil tirar conclusões
dos dados
(FP7-ENGAGE, 2011 )
É difícil envolver especialistas de domínio na transformação e
usar o processo de um conjunto de dados
(Klerk, 2011 )
Há muita duplicação, pouca reutilização e muito pouco
interoperabilidade entre conjuntos de dados
(McLaren e Waters, 2011 )
Conjuntos de dados são caros
(McLaren e Waters, 2011 )
Os conjuntos de dados têm licenças restritivas
(McLaren e Waters, 2011 )
A legislação de privacidade é uma barreira séria para iniciativas de dados abertos
( Kulk e Loenen , 2012 )
Ameaça de processos judiciais ou outras violações. Por exemplo, privacidade
pode ser violado pelo uso de dados
(Janssen et al., 2012 )
Fragmentação de software e aplicativos
(Janssen et al., 2012 )
Nenhum software padrão para processamento de dados abertos
(Janssen et al., 2012 )
Existe uma falta de acordo sobre URIs para recursos, que podem
resultar em associações ausentes entre recursos durante
dificuldade de integração e consolidação da entidade
(O'Riain et al., 2012 )
O leitor pode não ser livre para fazer o que quiser com o texto
ou dados por causa de licenças
(Molloy, 2011 )
Os usuários devem cumprir as condições padrão quando desejam
use os dados
(Juiz, 2010 )
Problemas de design de banco de dados podem dificultar a transformação
conjuntos de dados
(Klerk, 2011 )
Os dados são disponibilizados apenas em formatos que são difíceis ou
caro de usar
(European_Commission, 2011b )
As condições para diferentes tipos de reutilização podem ser diferentes
(Janssen, 2011 )
O desenvolvimento de produtos de informação transfronteiriços e
serviços é prejudicado pelas muitas regras e práticas diferentes
no que diz respeito aos procedimentos e condições de reutilização.
Reutilizadores em potencial não sabem onde encontrar os dados
eles precisam, ou eles são confrontados com obscuros ou restritivos
condições sob as quais eles podem reutilizar os dados
(Janssen, 2011 )
Há falta de transparência sobre a disponibilidade de
documentos e as condições sob as quais eles podem ser re-
usava
(Janssen, 2011 )
Os dados podem não ser atualizados em tempo hábil ou são obsoletos e não
válido
(Lee e Kwak, 2012 , Janssen
et al., 2012 )
Os dados podem estar simplesmente incorretos, mas também informações essenciais
sobre os conjuntos de dados podem estar ausentes, como o período de tempo
em que os dados foram coletados.
(Janssen et al., 2012)
Falta de flexibilidade no formato de dados
(Lee e Kwak, 2012 )
Falta de precisão e atualidade dos dados.
(Lee e Kwak, 2012 , Janssen
et al., 2012 )
Os dados estão normalmente disponíveis como estão (ou seja, em formas heterogêneas
estruturas e formatos), exigindo uma carga de trabalho humana substancial
para limpá-los para processamento de máquina e torná-los
compreensível
(Ding et al., 2011 )
Tornar públicos apenas dados que não agregam valor
(Janssen et al., 2012)
Dados semelhantes armazenados em sistemas diferentes produzem resultados diferentes
(Janssen et al., 2012 )
Falta de infraestrutura eficaz com capacidade de computação suficiente
para processar grandes dados e melhores mecanismos sociais para
distribuir a carga de trabalho humana necessária para as partes interessadas
comunidades
(Ding et al., 2011)

Sem suporte de ferramentas ou helpdesk


(Janssen et al., 2012)
Sem tempo para se aprofundar nos detalhes ou mesmo sem tempo
(Janssen et al., 2012 )
Pode haver problemas de usabilidade dos dados disponibilizados
(por exemplo, quando os dados são fornecidos em papel em vez de eletronicamente)
(Viglione et al., 2010 )
Indisponibilidade de infraestrutura de apoio e falta de
padrões, fragmentação e legado. Estes retratam a necessidade
para garantir uma boa infraestrutura antes do conceito de
os dados serão amplamente aceitos.
(Janssen et al., 2012)
O uso seria estimulado se mais informações sobre o caminho
dados abertos foram coletados e processados foram fornecidos por
incluindo metadados.
(Zuiderwijk e Janssen, 2012 )
O uso e a participação podem ser bloqueados, porque pode haver
sem incentivos ou valor agregado para os usuários fazerem uso de
Dados abertos.
(Janssen et al., 2012)
Valor pouco claro: as informações podem parecer irrelevantes ou
benigno quando visto isoladamente, mas quando vinculado e analisado
coletivamente, pode resultar em novos insights
(Janssen et al., 2012)
O foco está em fazer uso de conjuntos de dados únicos, enquanto o real
valor pode vir da combinação de vários conjuntos de dados
(Janssen et al., 2012)
3) Impedimentos de deposição de dados
Descrição
Literatura
Abrir dados por produtores de dados é uma tarefa complexa e
atividade compreendida.
(Zuiderwijk et al., 2012b )
Ameaça de violação de privacidade ao abrir dados e ser legalmente
responsável quando os dados abertos são mal utilizados.
(Kalidien et al., 2010 , Zuiderwijk
et al., 2012b ).
Embora muitas organizações governamentais possam estar dispostas a
abrir seus dados, faltam princípios orientadores derivados de
estudos de casos práticos que os ajudem a fazer isso.
(Kalampokis et al., 2011 ,
Zuiderwijk et al., 2012b ).
Sem suporte para disponibilizar dados
(Janssen et al., 2012)
Sistemas legados que complicam a publicação de dados
(Janssen et al., 2012)
A maioria das iniciativas de orientação são muito gerais (já que devem
cobrem muitos tipos de organizações e dados) e mal
fornecer suporte prático para a abertura de dados.
(Zuiderwijk e Janssen, 2012 )
Os sites aumentam as restrições aos formatos de dados para depósitos
(DataCite, 2011, Zuiderwijk et
al., 2012a ).
Os usuários são convidados a se registrar ou a se tornar um membro do
local na rede Internet
(Graaf e Waaijers, 2011 )
(DataCite, 2011 )
A prática de depósito de dados ainda está limitada a um
minoria de pesquisadores e o compartilhamento de dados está confinado a um
número limitado de conjuntos de dados
(Graaf e Waaijers, 2011)
Existem procedimentos de licenciamento complicados ou taxas proibitivas (European_Commission, 2011b )
Falta de mecanismos de participação pública
(Lee e Kwak, 2012 )
Organizações públicas não reagem à entrada do usuário
(Janssen et al., 2012 )
Não há mecanismos para garantir que os resultados da abertura
os dados são usados pelo governo.
(Janssen e Zuiderwijk, 2012 )
Qualidade discutível de entrada do usuário.
(Janssen et al., 2012)
Nenhum processo para lidar com a entrada do usuário
(Janssen et al., 2012 )
O processo de abertura de dados geralmente não é visto como uma interação
processo entre o governo e o público.
(Janssen e Zuiderwijk, 2012 )
O uso de dados abertos pode exigir um considerável
transformações das organizações do setor público.
(Janssen e Zuiderwijk, 2012 )
Os funcionários públicos parecem ser amplamente dominados pelo foco em
o processo de publicação e os desafios associados. No
Além disso, eles ficam satisfeitos se alguns dados são publicados sem
examinar cuidadosamente o uso real.
(Janssen e Zuiderwijk, 2012)

A visão geral mostra que a maioria da literatura menciona apenas um número limitado de impedimentos e barreiras
e não houve um trabalho de visão geral, com exceção de ( Janssen et al., 2012) .
Como os impedimentos mencionados anteriormente são derivados da literatura, é interessante compará-los
com impedimentos derivados de outras fontes. Uma visão geral dos impedimentos derivados de
as entrevistas e workshops serão dados na seção seguinte e comparados com todos os
impedimentos que são mencionados na
Tabela 1.

4 Visão geral e discussão de impedimentos sociotécnicos


Nesta seção, é fornecida uma visão geral dos impedimentos sociotécnicos que influenciam os dados abertos
processo do ponto de vista de um usuário de dados abertos. Além disso, a fonte de onde esses
impedimentos foram derivados é mostrado, de modo que uma comparação pode ser feita de quais tipos de
impedimentos são fornecidos por quais fontes. A visão geral do impedimento é apresentada em três diferentes
tabelas. Em linha com a seção 3.2, a Tabela 2 fornece uma visão geral dos impedimentos de acesso.
A Tabela 3 mostra os impedimentos de uso e a Tabela 4 mostra os impedimentos para a deposição de aberto
reutilizado
dados. Dentro dessas três categorias principais, várias subcategorias são fornecidas. As colunas no
Tabela 2: Visão geral dos impedimentos de acesso a dados sociotécnicos que influenciam os dados abertos
processo da perspectiva dos usuários de dados abertos.
Impedimento
eu
eu
C

1) Disponibilidade e acesso
Os dados não são coletados, especialmente dados detalhados.

Não está claro quais dados são coletados e disponíveis.

Não está claro qual organização coleta quais dados.

Os dados não são publicados, pois as organizações mantêm esses dados para si.

Os dados têm uma licença.

Não existe um conjunto uniforme de termos de licenciamento para o uso de dados.

Não está claro como obter uma licença para o uso de dados.

Os dados estão disponíveis apenas mediante solicitação, com permissão.

Os dados não estão disponíveis gratuitamente, uma (grande) taxa deve ser paga.

Os dados não são fornecidos continuamente; eles não são atualizados, de modo que o monitoramento não é
possível.
Os dados estão apenas parcialmente disponíveis.

Os dados estão disponíveis apenas para um determinado grupo de usuários (por exemplo, usuários comerciais,
pesquisadores ou organizações governamentais).

Os dados estão temporariamente indisponíveis no site.

Sem acesso aos dados originais, apenas dados processados.

É difícil obter dados recentes dos últimos anos.

Nem todos os formatos de dados desejados estão disponíveis.

Nenhuma boa preservação dos dados a longo prazo.

As organizações governamentais às vezes usam restrições que são proibidas de acordo


para a lei.

Nenhum compromisso de longo prazo com atualizações de dados por organizações fornecedoras de dados.

Nem todos os países do mundo adotaram políticas nacionais de dados abertos.

Há muita duplicação de conjuntos de dados.

Falta de dados atualizados regularmente.

Nenhuma pesquisa sobre as necessidades dos usuários de dados.

Muitos dados para processar.

2) Encontrar habilidade
Os dados não podem ser encontrados.
Sem possibilidades de pesquisa avançada.

Os metadados não foram encontrados.

Os dados estão fragmentados. Não existe um portal central para os dados de que você precisa para estudos. X

Dificuldade em pesquisar e navegar devido à falta de índice ou outros meios para garantir
pesquisa fácil para encontrar os dados certos

Os dados estão ocultos em relatórios e não podem ser encontrados em um formato legível por máquina.

lado direito da tabela mostra se o impedimento foi derivado da literatura (L), das entrevistas
(I) e / ou as oficinas (W). Alguns impedimentos foram derivados de fontes múltiplas.
Tabela 3: Visão geral dos impedimentos de uso de dados sociotécnicos que influenciam o processo de dados
abertos
da perspectiva dos usuários de dados abertos.
Impedimento
eu
eu
C
3) Usabilidade
Preocupações com a confiabilidade da fonte.
X
Os dados podem estar incorretos ou faltam informações essenciais.
X
Falta de (domínio) conhecimento sobre como tratar os dados.
X
X
É necessário aconselhamento especializado para usar os dados.
X
X
Não está claro quais novos modelos de negócios devem ser pensados para o uso de dados abertos.
X
Falta de serviços prestados pelo provedor de dados para usar dados brutos.
X
Sem interoperabilidade de infra-estruturas de dados abertas com outros sistemas.
X
X
Os dados não são relevantes / interessantes.
X
X
Nenhuma explicação sobre as licenças aplicadas para dados abertos.
X
X
Ameaça de processos judiciais ou outras violações.
X
Os usuários são forçados a empregar várias transformações arbitrárias de dados para criar dados
utilizável e comparável.
X
Os dados requerem uma carga de trabalho humana substancial para serem limpos para o processamento da máquina
e para torná-los compreensíveis.
X
Fragmentação de software e aplicativos.
X
Nenhum software padrão para processamento de dados abertos
X
Sem tempo para se aprofundar nos detalhes, ou mesmo sem tempo.
X
Sem incentivos ou sem valor agregado para os usuários fazerem uso de dados abertos.
X
4) Compreender a habilidade
Os dados não são compreensíveis para o público em geral (por exemplo, relacionados ao jargão).
X
Nenhuma explicação sobre o significado dos dados.
X
Os dados não são visualizados.
X
Metadados não são visualizados.
X
Falta de conhecimento sobre como interpretar os dados.
X
X
Indisponibilidade de infraestrutura de suporte.
X
Falta de uma boa API.
X
Falta de habilidades e recursos para usar os dados.
X
X
Falta de conhecimento estatístico.
X
Os dados são fornecidos em um idioma que o usuário não entende.
X
Os metadados são fornecidos em um idioma que o usuário não entende.
X
Os conjuntos de dados não estão completos.
X
Nenhuma informação sobre a proveniência (contexto) dos dados.
X
X
Nenhuma informação sobre o intervalo de tempo (validade) dos dados.
X
Nenhuma informação sobre a validade dos dados.
X
Sem gerenciamento de versão, descrevendo quem fez o quê e quando os conjuntos de dados são
disponíveis, de modo que é difícil compreender os dados.
X
Nenhum suporte e / ou ajuda e / ou treinamento para o uso dos dados é fornecido.
X
X

5) Qualidade
Os dados não são confiáveis.
X
Nenhum conhecimento sobre se a classificação dos dados é confiável.
X
Difícil determinar a qualidade dos dados.
X
Os dados são limitados ou de má qualidade.
X
X
Baixa qualidade das ontologias.
X
Falta de precisão dos dados.
X
X
Os dados são frequentemente baseados em abordagens políticas e intuição, em vez de uma adequada
nível de inteligência.
X
É difícil medir a qualidade dos dados de saídas combinadas.
X

Depois de apresentar os principais resultados, discutimos as diferenças entre os impedimentos que são
mencionados por fontes diferentes e fornecem possíveis explicações para essas diferenças. finalmente, o
limitações desta pesquisa de impedimento são discutidas.
Vários impedimentos de acesso aos dados foram mencionados pelas diferentes fontes. Os impedimentos de acesso
foram divididos nas categorias
1) disponibilidade e acesso e
2) capacidade de encontrar. A maioria dos impedimentos
pertencia à primeira categoria. Os impedimentos mencionados por todas as três fontes são
1) os dados são
não publicado, pois as organizações mantêm esses dados para si e
2) os dados não estão disponíveis gratuitamente,
uma (grande) taxa deve ser paga. O fato de todas as fontes mostrarem esses impedimentos pode ser uma razão para
priorizá-los.
A maioria dos impedimentos para o processo de dados abertos diz respeito ao uso real de dados abertos. A análise
mostra que as políticas de dados abertos fornecem pouca atenção à perspectiva do usuário, enquanto o usuário precisa
para gerar valor a partir dos dados abertos. Os impedimentos de uso foram divididos nas categorias usabilidade,
compreender capacidade, qualidade, vinculação e combinação de dados, comparabilidade e compatibilidade e
metadados.
Um impedimento foi mencionado por todas as três fontes, a saber, o impedimento de que a corrente
o fornecimento de metadados é insuficiente. O fato de todas as fontes mostrarem esse impedimento pode ser uma
razão para
dar prioridade a este impedimento.

5) Ligação e combinação de dados


É difícil vincular dados.

É difícil vincular dados vinculando metadados.


Os dados não podem ser vinculados a outros dados.
X
Não está claro como os dados baixados podem ser relacionados / vinculados a outros conjuntos de dados.
X
Ligar e combinar dados requer conhecimentos sofisticados.
X
Difícil de realizar pesquisas interdisciplinares, pois se pode ter conhecimento suficiente
sobre uma disciplina, mas não sobre a outra.
X
Dados de vinculação e ferramentas para vincular dados estão faltando.
X
Nenhum identificador exclusivo está disponível. Então, quando os dados estão vinculados a outros dados e o
o conjunto de dados original é atualizado, o outro não.
X
X
O foco está em fazer uso de conjuntos de dados únicos, enquanto o valor real pode vir de
combinando vários conjuntos de dados.
X
7) Comparabilidade e compatibilidade
Muitas diferenças nas definições de dados.
X
X
Diferentes tipos de políticas de dados abertos.
X
X
Fontes diferentes fornecem informações diferentes sobre o mesmo assunto.
X
X
Diferenças entre países. O uso de nomes de empresas ou códigos postais
podem ser muito diferentes nos países, o que pode levar a problemas com a vinculação de dados.
X
X
Diferenças entre organizações, por exemplo, diferenças na terminologia. Esta
torna muito difícil vincular e combinar conjuntos de dados.
X
X
Diferentes padrões de dados estão disponíveis e são usados.
X
Nenhum quadro jurídico harmonizado entre os países.
X
Nenhuma política uniforme para publicação de dados.
X
Falta de pesquisa sobre as diferenças entre as políticas de dados abertos.
X
Falta de padrões.
X
8) Metadados
Não há metadados comumente aceitos.
X
O fornecimento de metadados atual é insuficiente. Principalmente os metadados contextuais são
em falta.
X
X
X
Sem metadados sobre a qualidade dos dados.
X
X
Nenhum metadado sobre a forma como os dados foram coletados e medidos.
X
Os metadados podem ser interpretados de maneira diferente por diferentes usuários.
X
Mais informações sobre os parâmetros de metadados são necessárias em setores políticos específicos,
como gestão do conhecimento.
X
Não são fornecidas informações de domínio suficientes.
X
Os metadados não têm uma estrutura reconhecível (metadados agora são normalmente
descritivo).
X
Quando os metadados contêm suposições para o uso de dados abertos, eles podem apontar para
certas escolhas e interpretações. Isso pode inconscientemente excluir certas maneiras de
reutilizando dados.
X

Os impedimentos de deposição foram divididos nas categorias de interação com o provedor de dados e
abrindo e enviando. Todos os impedimentos de deposição, exceto um, foram derivados da literatura. Nenhum
os impedimentos encontrados na literatura foram confirmados pelas entrevistas ou oficinas.
4.1.1 Diferenças de fonte
Analisando as Tabelas 2, 3 e 4, vemos que muitos tipos diferentes de impedimentos para os dados abertos
processo são mencionados na literatura, nas entrevistas e nas oficinas. A literatura frequentemente fornece
impedimentos de nível, enquanto nas entrevistas e workshops impedimentos mais detalhados foram
revelado. Isso mostra a complexidade de categorizar impedimentos, já que alguns deles são parcialmente
sobrepostos ou podem ser vistos como subconjuntos de outros. Por exemplo, criamos uma categoria separada para
impedimentos que estão relacionados à qualidade dos dados, mas impedimentos relacionados à qualidade também
podem ser
categorizado na categoria de usabilidade ou metadados.
O impressionante é que as fontes nem sempre se confirmam. A maioria dos impedimentos apresentados são
mencionado apenas por uma ou duas fontes, mas não por todas elas. A literatura forneceu muitos
tipos de impedimentos para as categorias de disponibilidade e acesso aos dados, usabilidade e abertura e
Enviando. Impedimentos nas categorias de capacidade de compreensão e metadados foram menos mencionados por
literatura. Durante a análise, notamos que os mesmos impedimentos sobre disponibilidade e acesso,
metadados e qualidade de dados foram mencionados por um grande número de fontes de literatura. Por exemplo,
impedimentos como os dados não são publicados, a qualidade é limitada ou pouco clara e insuficiente
metadados são fornecidos, foram mencionados em muitas publicações.
Os entrevistados mencionaram vários impedimentos para o uso de dados abertos em cada impedimento
categoria. Eles não se concentraram muito em uma categoria, embora impedimentos nas categorias
disponibilidade e acesso, capacidade de localização, vinculação e combinação de dados e metadados foram
ligeiramente mencionados
mais. Poucos impedimentos foram mencionados para as categorias compreender habilidade e abertura e
Enviando.
Tabela 4: Visão geral dos impedimentos de deposição de dados sociotécnicos que influenciam os dados abertos
processo da perspectiva dos usuários de dados abertos.
Impedimento
eu
eu
C
9) Interação com o provedor de dados
Nenhuma discussão entre o provedor de dados e o usuário de dados é possível.
X
X
Nenhuma plataforma ou mecanismo de participação disponível.
X
10) Abrindo e enviando
Dificuldades com o upload (reutilizado) de conjuntos de dados.
X
Ameaça de violação de privacidade ao publicar dados.
X
Ameaça de ser legalmente responsável quando os dados abertos são mal utilizados.
X
Falta de princípios orientadores e suporte para a abertura de dados.
X
Os sites aumentam as restrições aos formatos de dados para depósitos.
X
Os usuários são convidados a se registrar ou se tornar um membro do site.
X
A prática de depósito de dados atualmente ainda é limitada a uma minoria de pesquisadores
e o compartilhamento de dados está confinado a um número limitado de conjuntos de dados.
X
Não há mecanismos para garantir que os resultados de dados abertos sejam usados pelo governo.
X
Há uma falta de clareza sobre os termos de reutilização.
X
Existem procedimentos de licenciamento complicados ou taxas proibitivas.
X
Os sistemas legados complicam a publicação de dados.
X
Qualidade discutível de entrada do usuário.
X
As organizações públicas não reagem à entrada do usuário.
X
Nenhum processo para lidar com a entrada do usuário.
X
O processo de dados abertos não é visto como um processo de interação entre o
governo e o público.
X
O uso de dados abertos pode exigir transformações consideráveis do setor público
organizações.
X
Os funcionários públicos parecem ser amplamente dominados pelo foco no processo de publicação
e os desafios associados.
X

As oficinas realizadas proporcionaram o menor número de impedimentos. Em comparação com o


revisão da literatura e entrevistas, as oficinas forneceram alguns impedimentos nas categorias
disponibilidade e acesso, capacidade de encontrar, usabilidade, qualidade e metadados. Durante os workshops,
relativamente
muitos impedimentos foram mencionados na categoria capacidade de compreensão. Sem impedimentos foram
mencionado sobre vinculação e combinação e abertura e upload de dados.
Embora algumas semelhanças tenham sido encontradas nos impedimentos que foram mencionados durante os quatro
workshops, a maioria dos impedimentos de workshop das Tabelas 2, 3 e 4 foram derivados de diferentes workshops.
As diferenças entre os impedimentos da oficina não podem ser atribuídas a diferenças no tipo de
participantes, visto que a maioria das oficinas em geral teve os mesmos grupos de participantes.

4.2 Possível explicação das diferenças de fonte

Não esperávamos encontrar impedimentos diferentes de fontes diferentes. Uma primeira explicação possível para
as diferenças de origem podem ser os diferentes objetivos e configurações da coleta de dados. Mais literatura
comunica uma certa ideia ou fornece argumentação para uma determinada afirmação e não tem como objetivo
fornecem uma ampla visão geral de todos os impedimentos para o processo de dados abertos. Mais literatura apenas
menciona alguns impedimentos de alto nível, mas não se concentra muito em impedimentos detalhados.
Impedimentos mencionados pela literatura foram frequentemente usados para introduzir um tópico e fornecer suporte
para
escrevendo um artigo. As entrevistas se concentraram na obtenção de informações mais aprofundadas sobre
impedimentos para o uso de dados abertos e metadados e informações básicas relacionadas. O
workshops com o objetivo de discutir exaustivamente e obter feedback sobre certas ideias, como
infraestruturas de dados. Em todas as oficinas, pelo menos uma apresentação foi feita sobre o uso de dados abertos,
que estimulou os participantes a fazerem perguntas sobre este uso no contexto da apresentação e
discuta-o depois, às vezes com base em várias declarações. Isso pode ter resultado em um
certo preconceito em relação às questões apresentadas ou abordadas pelo apresentador. O contexto do
vários workshops podem ter sido diferentes. O workshop forneceu um contexto específico em que o
impedimentos foram mencionados. Eles só podem ser aplicáveis nesse contexto.
Além disso, os entrevistados e os participantes das oficinas eram principalmente acadêmicos. O
impedimentos que são fornecidos na literatura não vêm apenas de acadêmicos, mas também de
profissionais e formuladores de políticas. Pessoas com experiências diferentes podem ter perspectivas diferentes
em impedimentos de dados abertos.
As diferenças entre os impedimentos que foram encontrados na literatura atual e os impedimentos
que foram encontrados na pesquisa empírica pode ser parcialmente devido ao fato de que a literatura não paga
atenção para fornecer uma visão geral estruturada dos impedimentos. Além disso, os impedimentos de dados abertos
são
provavelmente mudará com o tempo, pois no passado um impedimento poderia ser não ter uma única loja para
publicar
dados abertos, enquanto hoje em dia a maioria dos países introduziu um portal de dados abertos para publicar seus
dados. Além disso, no passado, a disponibilidade de conjuntos de dados pode ser um problema, enquanto hoje em dia
mais
e mais dados estão disponíveis. No entanto, espera-se que uma revisão da literatura mais completa tenha resultado
em mais repetição dos mesmos impedimentos em vez de uma extensão dos impedimentos que foram
encontrado, como muita repetição de impedimentos já foi encontrada em nossa visão geral da literatura atual.
Portanto, podemos concluir que os impedimentos encontrados na literatura eram incompletos e que nossa
tabela que inclui literatura e pesquisa empírica é mais abrangente.
Outra possível explicação para as diferenças de impedimentos que foram mencionados por diferentes
fontes podem ser o fato de que o campo de dados abertos é relativamente novo. Como não é muito sistemático
a pesquisa foi realizada no campo de dados abertos, nenhuma visão geral abrangente de impedimento pode
ser derivado da literatura.
4.3 Limitações
Na introdução, argumentamos que a criação de uma visão geral dos impedimentos sociotécnicos é relevante,
como uma ampla visão geral desses impedimentos do processo de dados abertos pode fornecer
conhecimento sobre quais impedimentos existem atualmente. As seções anteriores mostraram quais
impedimentos que derivamos da literatura, entrevistas e workshops. No entanto, identificando todos
impedimentos é difícil por várias razões. Em primeiro lugar, a busca por literatura de dados abertos fornece
resultados consideráveis em máquinas de busca online e nem todos esses resultados puderam ser examinados. Além
disso,
durante as entrevistas e workshops podem ter sido mencionados impedimentos que foram interpretados em
de uma forma diferente daquela que os participantes pretendiam dizer ou eles podem nem ter sido notados.
Além disso, outras fontes, como questionários e grupos de foco e outros grupos de dados abertos

usuários, como desenvolvedores e jornalistas, podem fornecer ainda mais ou outras informações de impedimento.
Além disso, os impedimentos podem se sobrepor. Portanto, é difícil avaliar se o impedimento
a visão geral apresentada neste artigo está completa. Além disso, os impedimentos têm diferentes
níveis de abstração, às vezes são de alto nível, enquanto em outras situações são muito detalhados.
Este é um dos motivos pelos quais é difícil comparar a literatura com nossa pesquisa empírica.
Na introdução, foi afirmado que uma visão geral dos impedimentos sociotécnicos poderia nos ajudar
identificar quais desafios devem ser enfrentados por políticas e estratégias de dados abertos. O
visão geral de impedimentos mostra quais impedimentos foram mencionados por todas as fontes e poderiam ter
prioridade
em políticas e estratégias de dados abertos. No entanto, a visão geral do impedimento não mostra quantos
vezes um certo impedimento foi mencionado por uma fonte. Por exemplo, um impedimento pode ter
foi mencionado em dez publicações de literatura, mas nunca durante as entrevistas ou workshops. No
visão geral do impedimento este impedimento pode parecer não ser muito importante, embora a literatura tenha
mostrado que é importante. Essas limitações devem ser levadas em consideração na interpretação do
visão geral do impedimento.
5. Conclusões
O valor potencial dos dados abertos é enorme. No entanto, percebendo efeitos positivos e
criar valor público com o uso de dados abertos em grande escala parece ser muito ambicioso neste
momento, como o processo em que os dados são publicados, encontrados, usados, vinculados, reutilizados e
discutidos,
que é aqui referido como o processo de dados abertos, encontra muitos impedimentos que impedem ou
bloquear a publicação ou uso de dados abertos. Apesar de sua importância, nenhuma visão ampla do
impedimentos sociotécnicos do processo de dados abertos estão disponíveis a partir da perspectiva do
usuário de dados.
Com base em uma visão geral da literatura (37 documentos), quatro workshops e seis entrevistas, 118
foram identificados impedimentos técnicos para o uso de dados abertos. A análise mostrou que
atenção é dada à perspectiva do usuário, enquanto o usuário precisa gerar valor a partir do
dados. Os impedimentos que o processo de dados abertos encontra atualmente foram categorizados em dez
categorias: 1) disponibilidade e acesso, 2) capacidade de encontrar, 3) usabilidade, 4) capacidade de compreensão, 5)
qualidade, 6)
vinculação e combinação de dados, 7) comparabilidade e compatibilidade, 8) metadados, 9) interação com o
provedor de dados e 10) abertura e upload.
Os impedimentos provavelmente mudarão com o tempo. Novas políticas e infraestruturas provavelmente resolverão
muitos dos
os impedimentos atuais, e devido a novas e maiores expectativas, novos impedimentos podem surgir
Tempo. Por exemplo, uma única loja de dados abertos era um obstáculo alguns anos atrás, mas dificilmente é
hoje em dia, visto que a maioria dos países estabeleceu um portal de dados abertos. Diferentes tipos de impedimentos
foram derivados de diferentes fontes. Diferenças também foram encontradas dentro do mesmo tipo de fonte. No
Além disso, concluímos que os impedimentos que foram encontrados na literatura diferiam dos impedimentos
que foram encontrados em pesquisas empíricas. Os impedimentos encontrados na literatura podem ter sido
incompletos
e nossa visão geral dos impedimentos derivados da literatura e da pesquisa empírica é
mais abrangente. A visão abrangente dos impedimentos pode ser usada como base para
melhorar o processo de dados abertos para que efeitos positivos possam ser realizados. Mais pesquisas deveriam ser
realizada para avaliar se outras fontes e outros grupos de usuários fornecem mais ou outros
informações de impedimento, para avaliar a importância dos impedimentos individuais e examinar
se certos impedimentos atrapalham o processo de dados abertos mais do que outros.
6 Agradecimentos
Este artigo está relacionado ao Projeto de Infraestrutura ENGAGE FP7 (An Infrastructure for Open, Linked
Provisão de dados governamentais para comunidades de pesquisa e cidadãos). Os autores gostariam
agradecer a seus colegas do projeto ENGAGE por suas contribuições para este artigo, embora as opiniões
expressas são as opiniões dos autores e não necessariamente do projeto. Além disso, os autores
gostaria de agradecer a todas as pessoas que forneceram informações sobre os impedimentos do processo de dados
abertos
durante as oficinas e entrevistas

Você também pode gostar