Escolar Documentos
Profissional Documentos
Cultura Documentos
Resumo : Há uma demanda crescente para a abertura de dados fornecidos por organizações públicas e privadas. Vários
as organizações já começaram a publicar seus dados e, potencialmente, há muitos benefícios a serem ganhos. Contudo,
perceber os efeitos positivos pretendidos e criar valor com o uso de dados abertos em grande escala é mais fácil de dizer
do que feito. A abertura e o uso de dados encontram numerosos impedimentos que podem ter um sócio e um
natureza técnica. No entanto, nenhuma visão geral dos impedimentos está disponível da perspectiva do usuário de dados
abertos.
Os impedimentos sociotécnicos para o uso de dados abertos foram identificados com base em uma visão geral da literatura,
quatro
workshops e seis entrevistas. Uma análise desses 118 impedimentos mostra que as políticas de dados abertos fornecem
atenção à perspectiva do usuário, sendo os usuários quem geram valor a partir dos dados abertos. Os impedimentos
que o processo de dados abertos encontra atualmente foram analisados e categorizados em dez categorias: 1) disponibilidade
e acesso, 2) encontrar capacidade, 3) usabilidade, 4) compreender capacidade, 5) qualidade, 6) vincular e combinar dados, 7)
comparabilidade e compatibilidade, 8) metadados, 9) interação com o provedor de dados e 10) abertura e
Enviando. Os impedimentos encontrados na literatura diferem dos impedimentos encontrados na pesquisa empírica.
Nossa visão geral dos impedimentos derivados da literatura e da pesquisa empírica é, portanto, mais
abrangente do que já estava disponível. A visão abrangente dos impedimentos pode ser usada como um
base para melhorar o processo de dados abertos, e pode ser estendido em pesquisas futuras. Isso resultará na resolução
de alguns impedimentos e novos impedimentos podem aumentar com o tempo.
Palavras - chave : dados abertos, dados governamentais abertos, impedimentos, barreiras, desafios, problemas, perspectiva
do usuário.
1. Introdução
Recentemente, os dados abertos estão ganhando importância no contexto de uma demanda crescente por abertura de
público
e organizações privadas. Por exemplo, a administração Obama e a Comissão Europeia
cada vez mais apelo por abertura (Obama, 2009 , European_Commission, 2003). Público e privado
as organizações estão sob pressão crescente para divulgar seus dados a uma variedade de usuários, incluindo
investigadores, cidadãos, empresas e funcionários públicos. Organizações em países de todo o mundo
já começaram a publicar seus dados e vários exemplos de sua utilização já são conhecidos. Pra
por exemplo, na Holanda, um aplicativo foi desenvolvido mostrando fotos históricas, filmes e outros
informações durante um passeio pela cidade, com base na localização geográfica do usuário
(http://www.appsvoornederland.nl/apps/vistory-the-interactive-historical-video- app). Outro exemplo
vem da Care Quality Commission do Reino Unido, que publica taxas de sobrevivência
após a cirurgia cardíaca, com o objetivo de ajudar as pessoas que precisam de cirurgia cardíaca a fazer escolhas
informadas sobre deles Cuidado e
tratamento para melhorar
a
qualidade
de
cuidados de saúde
(http://heartsurgery.cqc.org.uk/survival.aspx) .
O valor potencial dos dados abertos é enorme e espera-se que resulte em aplicativos e
práticas que atualmente não temos conhecimento (Dekkers et al., 2006 , European_Commission, 2011b).
No entanto, o processo em que os dados são publicados, encontrados, usados, vinculados, reutilizados e discutidos,
que
é aqui referido como o processo de dados abertos, parece encontrar muitos impedimentos sociotécnicos.
Impedimentos são aqueles fatores que dificultam ou bloqueiam o uso de dados abertos. Sócio técnico
impedimentos dizem respeito aos humanos e à tecnologia. De acordo com Bostrom e Heinen, “o técnico
sistema está preocupado com os processos, tarefas e tecnologia necessária para transformar entradas em saídas ”
Considerando que “o sistema social está preocupado com os atributos das pessoas (por exemplo, atitudes,
habilidades, valores),
as relações entre as pessoas, sistemas de recompensa e estruturas de autoridade ”. O técnico e social
presume-se que os sistemas interagem (Bostrom e Heinen, 1977a , Bostrom e Heinen, 1977b).
O processo de dados abertos implica que os dados abertos não devem ser vistos apenas como um produto, mas como
um
processo em andamento (Janssen e Zuiderwijk, 2012 ), pois novos aplicativos e o uso de dados abertos podem
resulta em novos insights que podem resultar em novas maneiras de usar dados abertos. No processo de dados
abertos,
organizações públicas abrem seus dados que podem ser usados por cidadãos, empresas, pesquisadores, civis
servidores e outros tipos de usuários. De um alto nível, o processo de dados abertos pode ser dividido em cinco
etapas básicas. Primeiro, as organizações governamentais produzem, coletam e integram grandes quantidades de
dados para
ser capaz de cumprir suas tarefas (ver caixa 1 na Figura 1). A produção desses dados é financiada pelo público
dinheiro. Em segundo lugar, os órgãos públicos decidem se irão abrir, ou seja, publicar, seus dados (ver caixa 2). Esta
pode estar no próprio site, em um portal nacional ou em qualquer outra plataforma, como a plataforma Engage
(www.engage-data.eu). De acordo com a Comissão Europeia, os dados de abertura devem ser realizados até
disponibilizando todos os tipos de dados não sensíveis à privacidade na Internet (European_Commission,
2011a) . Os dados governamentais publicados são então chamados de dados abertos . Dados abertos que são
encontrados por potenciais usuários de dados abertos (ver caixa 3) “podem ser usados, reutilizados e redistribuídos
por todos,
sem restrições de direitos autorais, patentes ou outros mecanismos de controle ” (LinkedGov, 2011 ,
Open_Knowledge_Foundation, 2011, Sweeney, 2009) (ver caixa 4).
Uma possibilidade de reutilizar dados governamentais abertos é vinculá-los a outros dados, para que as relações
com outros dados podem ser mostrados ( Berners-Lee, 2009) . Os dados vinculados que são o resultado deste
ligando
estamos
definiram
como
"uma
coleção
de
inter-relacionado
conjuntos de dados
sobre
a
Rede"
(World_Wide_Web_Consortium, 2011, http://www.w3.org/standards/semanticweb/data). Dados que são
ambos abertos e vinculados, chamados de Linked Open Data (LOD), são dados que atendem aos requisitos de
dados abertos e que mostram relações entre os dados abertos também. Dados governamentais abertos obtidos
mais valor quando estão vinculados em comparação com dados governamentais abertos que não estão vinculados
( Berners-
Lee, 2009). Além disso, no processo de dados abertos ideal, informações de feedback sobre o uso dos dados
é fornecido aos órgãos públicos que produziram os dados (ver caixa 5), para que esses dados possam ser usados para
melhorar os processos de trabalho, como processos de formulação de políticas de órgãos públicos (Janssen e
Zuiderwijk,
2012) .
Figura 1: Representação de alto nível do processo de dados abertos, incluindo ambos (governamental)
organizações) e usuários
Apesar de sua importância, nenhuma visão abrangente dos impedimentos sociotécnicos dos dados abertos
processo está disponível a partir da perspectiva do usuário de dados abertos. Muitos estudos investigaram
impedimentos sociotécnicos que estão relacionados à perspectiva do provedor dos dados (para
exemplo, Huijboom e Broek, 2011, Zhang et al., 2005, Conradie e Choenni, 2012, Meijer e
Thaens, 2009, Janssen et al., 2012, Zuiderwijk et al., 2012b), considerando os impedimentos que os usuários de
experiências de dados abertos são frequentemente negligenciadas (Blakemore e Craglia, 2006, Janssen et al., 2012).
A criação de uma visão geral dos impedimentos sociotécnicos é relevante, como uma ampla visão geral de
esses impedimentos do processo de dados abertos podem fornecer conhecimento prático sobre quais
5. Discutindo e
fornecendo feedback sobre
dados abertos (vinculados)
2. Dados de abertura
3. Encontrar dados abertos
4. Usando dados abertos (por exemplo
curadoria, anotação,
aprimoramento, processamento,
visualizando, vinculando)
1. Criação de dados (por exemplo
produzindo, coletando,
armazenar e pagar por
dados)
(Governamental)
organizações
Comercial
impedimentos existem atualmente e quais desafios devem ser enfrentados por políticas de dados abertos e
estratégias.
Este artigo tem como objetivo fornecer uma ampla visão geral dos impedimentos sociotécnicos dos dados abertos
processo da perspectiva do usuário, analisando os resultados de uma visão geral da literatura, entrevistas e
workshops. Na seção seguinte, a abordagem da pesquisa será apresentada. Posteriormente, nós
descrever um pano de fundo para a identificação de impedimentos com base em políticas de dados abertos e o
impedimentos que encontramos na literatura. Isso é seguido por uma visão geral e discussão de
impedimentos técnicos, incluindo tabelas com impedimentos categorizados e discussões da fonte
diferenças, possíveis explicações para essas diferenças e limitações desta pesquisa. Nós concluimos
o artigo com as principais conclusões desta pesquisa de impedimento.
Partes deste artigo foram publicadas nas atas da 12ª Conferência Europeia sobre
eGovernment (ECEG) ( Zuiderwijk et al., 2012a) .
2 Abordagem de pesquisa
O objetivo deste artigo é criar uma visão abrangente dos vários tipos de sociotécnica
impedimentos. Essa lista pode ser usada para melhorar infraestruturas de dados abertos, políticas e estratégias.
O processo de dados abertos pode ser melhorado e efeitos positivos podem ser obtidos. Optamos por usar
várias fontes, visto que se espera que forneça uma visão geral mais abrangente dos impedimentos do que
uma única fonte. Começamos criando uma visão geral da literatura, que resultou na identificação de
categorias de impedimento inicial e nossa lista inicial de impedimentos. Posteriormente, a pesquisa empírica foi
conduzida através da organização de quatro workshops e seis entrevistas, uma vez que essas fontes poderiam ser
usadas para alcançar
diferentes tipos de usuários de dados abertos, incluindo pesquisadores, funcionários públicos, desenvolvedores,
jornalistas e
empresas.
A visão geral da literatura é criada pesquisando artigos de periódicos, artigos de conferências, livros,
relatórios governamentais e não governamentais e outras informações em vários bancos de dados, incluindo
Science Direct, Scopus, TU Delft Repository, Google Scholar e Google. Palavras-chave que foram usadas
durante esta pesquisa foram combinações dos termos dados abertos, dados do governo aberto, link aberto
dados, Informação do Setor Público (PSI), uso de dados abertos, impedimento de dados abertos, barreira de dados
abertos, aberto
problema de dados, restrição de dados abertos e desafio de dados abertos. No total, aproximadamente 1.555.000
documentos foram encontrados na base de dados Science Direct, 552.000 no Scopus, 7.000 na TU Delft
Repositório, 2.000.000 no Google Scholar e 211.000.000 no Google. Pode haver uma sobreposição
entre esses documentos. Os documentos foram filtrados em busca de impedimentos, barreiras,
problemas e desafios para o uso de dados abertos. A maioria dos documentos obtidos parecia não
ser útil, pois não descreveu nenhum impedimento para o processo de abertura de dados. No total, 37
foram selecionadas publicações relevantes e, a partir delas, uma visão geral dos impedimentos para o
uso de dados abertos foi criado. A relevância dos resultados foi determinada pelas máquinas de pesquisa e
escaneando os títulos e resumos dos documentos.
2.2 Entrevistas
Para obter uma melhor compreensão dos impedimentos que foram descritos na literatura e obter mais
informações detalhadas, entrevistas semiestruturadas com especialistas foram realizadas com seis pessoas-chave que
trabalhou com dados abertos e / ou trabalhou frequentemente com pessoas que trabalharam com dados abertos. Os
entrevistados
trabalhou principalmente nas disciplinas de ciências sociais e humanas, pois não havia infraestruturas de dados
abertos suficientes
existem nestas disciplinas e, por esta razão, espera-se que os impedimentos sejam experimentados por estes
entrevistados. A decisão de entrevistar essas seis pessoas foi baseada em sua experiência com o uso
de dados abertos, sua reputação e posição reconhecidas e respeitáveis, seu histórico de
produção de publicações, seu histórico de participação em conferências e seu alcance além do estrito
e comunidades especializadas. Finalmente, a decisão de entrevistar essas seis pessoas foi baseada em seus
disposição em participar desta pesquisa. Todas as entrevistas foram realizadas em dezembro de 2011 e
Janeiro de 2012. Durante as entrevistas, os entrevistados foram questionados sobre quais tipos de dados abertos e
metadados que eles usaram, de que forma, quais impedimentos eles notaram durante o uso de dados abertos e
metadados, quais desafios existiam para o uso de dados abertos e metadados e quais os seus
os requisitos e necessidades eram para dados e metadados abertos.
Todas as entrevistas foram transcritas. Após a realização das entrevistas, os entrevistados foram questionados se
uma transcrição da entrevista pode ser enviada para aprovação. Todos os entrevistados concordaram com isso e
todas as transcrições foram enviadas aos entrevistados em poucos dias. Os entrevistados foram convidados a
fornecer comentários sobre a transcrição dentro de duas semanas, caso eles não concordem (totalmente) com ela,
então
que a transcrição pode ser assimilada.
2.3 Workshops
Para ampliar nosso conhecimento sobre quais impedimentos sociotécnicos atualmente influenciam o aberto
processo de dados, realizamos quatro workshops em eventos internacionais. As oficinas voltadas para
envolvendo uma composição diversa de usuários de dados abertos, como se espera que diferentes usuários
mencionem
impedimentos diferentes. Além disso, vários workshops foram realizados em vários países para que um
grande número de pessoas com diferentes nacionalidades seria alcançado, o que diminui o risco em
conclusões inválidas ou específicas do país. A Tabela 1 mostra as oficinas que foram organizadas.
Embora várias ideias sobre os impedimentos do uso de dados abertos tenham sido discutidas pelo
organizadores dessas oficinas, apenas aqueles impedimentos que foram confirmados pelos participantes são
descrito neste artigo.
3 Antecedentes da literatura
Nesta seção, descrevemos várias políticas de dados abertos, que resultaram em impedimentos para o
processo de dados aberto. Por fim, são apresentados os impedimentos encontrados na literatura.
Os impedimentos do processo de dados abertos podem ser tratados desenvolvendo boas políticas de dados abertos. A
importante política de dados abertos é a Diretiva de Informação do Setor Público (PSI) da UE, na qual um
foi apresentado o quadro legislativo que regulamenta a disponibilização de dados de órgãos do setor público para
reutilização (European_Commission, 2003). Neste relatório, a Comissão Europeia (CE) argumentou que um
quadro geral “é necessário para garantir condições justas, proporcionais e não discriminatórias
O objetivo era obter uma visão da forma como os dados abertos são usados
e reutilizado atualmente, incluindo os benefícios e impedimentos
que são típicos para dados governamentais abertos atualmente disponíveis.
Em relação aos benefícios e impedimentos, em particular o papel do
metadados foram discutidos durante este workshop.
Embora o movimento de dados abertos seja guiado por diretrizes, estratégias e políticas nacionais do PSI,
as políticas de dados são acompanhadas por muitos impedimentos. Pesquisas anteriores mostraram que existem
pelo menos três categorias principais de impedimentos das políticas atuais de dados abertos da perspectiva do
do utilizador. Em primeiro lugar, existem impedimentos de acesso aos dados, que estão relacionados à criação,
abertura, localização e
obtenção dos dados (caixa 1, 2 e 3 da Figura 1). Em segundo lugar, os impedimentos de uso de dados restringem
diretamente o uso
de dados abertos (caixa 4 na Figura 1). Terceiro, impedimentos de depósito de dados tornam difícil armazenar,
discutir e
fornecer feedback sobre conjuntos de dados (caixa 5 na Figura 1). Os principais impedimentos das atuais políticas de
dados abertos
são mostrados na Tabela 1.
Tabela 1: Impedimentos derivados da literatura.
1) Impedimento de acesso a dados
Descrição
Literatura
Obter acesso aos dados é difícil.
(Boulton et al., 2011 , McLaren
e Waters, 2011 ,
European_Commission, 2011b )
PSI é publicado em várias fontes fragmentadas, o que torna
é difícil encontrá-los.
(Vickery e Wunsch-Vincent,
2006 )
As informações de PSI são depositadas em várias fontes fragmentadas, então
que os usuários têm dificuldade em encontrar os dados.
(FP7-ENGAGE, 2011 )
Uma grande barreira é o acesso a uma rede adequada e apropriada
conjuntos de dados.
(Conradie e Choenni, 2012 ,
Janssen et al., 2012 )
Os dados estão temporariamente indisponíveis no site
(Veljković et al., 2011 )
Os dados estão apenas parcialmente disponíveis; informação incompleta
(DataCite, 2011, Janssen et al.,
2012 )
Sem acesso aos dados originais, apenas dados processados. Esconder aplicativos
a complexidade, mas também o potencial do uso de dados abertos
(Janssen et al., 2012)
Descrição
Literatura
Muitos sites PSI requerem ação do ponto de vista do
usuário, por exemplo, registro, adesão, preenchimento de um formulário,
obter permissão por escrito ou uma taxa
(Blakemore e Craglia, 2006 ,
Meijer e Thaens, 2009 ,
Murray-Rust, 2008, Janssen et
al., 2012 ).
O acesso aos dados é restrito a um grupo de usuários
(DataCite, 2011 )
Os usuários podem ter que aceitar uma variedade de acordos de uso antes
eles podem obter acesso aos dados originais. Não tem uniforme
conjunto de termos de licenciamento para sua reutilização
(DataCite, 2011 , Judge, 2010,
Vickery e Wunsch-Vincent,
2006, Janssen et al., 2012)
Persistem diferenças significativas nas regras e práticas nacionais.
Isso leva à fragmentação do mercado interno de informação
e impede a criação de serviços de informação transfronteiriços
(European_Commission, 2011a )
Os conjuntos de dados são fragmentados e oferecidos em vários sites,
que em alguns casos são difíceis de encontrar acesso a conjuntos de dados estão em
alguns casos restritos a grupos de usuários específicos. Não é n o
portal central ou arquitetura
(Conradie e Choenni, 2012 ,
Janssen et al., 2012 )
Dificuldade em pesquisar e navegar devido a nenhum índice ou outro
significa garantir uma busca fácil para encontrar os dados certos
(Janssen et al., 2012 )
A receita de várias organizações governamentais é baseada em
a venda de dados, o que os torna relutantes em publicar o
dados
(Huijboom e Broek, 2011 )
Os cientistas geralmente veem os dados publicados como pertencentes ao
comunidade científica, mas muitos editores reivindicam direitos autorais sobre
dados e não permitirá sua reutilização sem permissão.
(Murray-Rust, 2008 )
Muitos conjuntos de dados de propriedade pública habilitados para localização não foram
fácil de acessar e montar no local e central
órgãos governamentais
(McLaren e Waters, 2011 )
A noção de acesso é contestada e é o resultado de um
processo político. Existe um conjunto de tensões características que
tornam muito difícil para as partes envolvidas (produtores,
corretores intermediários, usuários de informações e cidadãos) para encontrar
um terreno comum eficaz em um debate que deve se concentrar em
construindo os "bens comuns da informação".
(Blakemore e Craglia, 2006 )
As administrações normalmente expressam relutância em tornar seus dados
e metadados (informações sobre os dados) disponíveis, para
vários aspectos culturais, políticos, jurídicos, institucionais e técnicos
razões. Eles mantêm dados e metadados dentro de seu legado
sistemas, cercados e isolados
(European_Commission, 2011c )
O usuário potencial não pode obter acesso aos dados, por exemplo
por causa da sobrecarga administrativa, usuário diferente
registros, termos de acesso e outras barreiras
(FP7-ENGAGE, 2011 )
Os dados são mantidos a portas fechadas ou paredes de pagamento que exigem
que as pessoas comprem quais informações estão disponíveis
(Vogel, 2011 )
Há falta de informação de que certos dados realmente existem
e está disponível
(European_Commission, 2011b )
Existe uma falta de clareza de qual autoridade pública detém o
dados
(European_Commission, 2011b )
Existe o perigo de órgãos do setor público abusarem de seus
poder de monopólio como o único produtor de um tipo particular de
dados para cobrar preços excessivos
(Janssen, 2011 )
Os legisladores podem ter feito contratos rígidos de limitação de acesso
com vários fornecedores comerciais, de modo que os dados não podem ser
acessado por partes interessadas externas.
(Napoli e Karaganis, 2010 )
Pode haver barreiras práticas, como dificuldades em obter
acesso aos dados (por exemplo, atrasos indevidos).
(Viglione et al., 2010 )
Acordos de reutilização exclusiva com um ator comercial ou
uso restrito a uma empresa estatal
(European_Commission, 2011b )
Nem todos os países do mundo adotaram dados abertos nacionais
políticas.
(Schellong e Stepanets, 2011 ,
Zuiderwijk e Janssen, 2012 )
Nenhuma pesquisa sobre as necessidades dos usuários de dados.
(Zuiderwijk e Janssen, 2012)
Muitos conjuntos de dados de propriedade pública habilitados para localização não foram
fácil de analisar em órgãos do governo local e central.
McLaren e Waters 2011 )
O foco do debate PSI está centrado em uma agenda
articulado principalmente por meio do poder dos produtores PSI,
e menos nas necessidades do cidadão / consumidor
(Blakemore e Craglia, 2006 )
Os usuários de dados acham difícil interpretar os dados, porque eles
não estão familiarizados com as definições e categorias que são usadas para
apresentar os dados. Portanto, é difícil tirar conclusões
dos dados
(FP7-ENGAGE, 2011 )
É difícil envolver especialistas de domínio na transformação e
usar o processo de um conjunto de dados
(Klerk, 2011 )
Há muita duplicação, pouca reutilização e muito pouco
interoperabilidade entre conjuntos de dados
(McLaren e Waters, 2011 )
Conjuntos de dados são caros
(McLaren e Waters, 2011 )
Os conjuntos de dados têm licenças restritivas
(McLaren e Waters, 2011 )
A legislação de privacidade é uma barreira séria para iniciativas de dados abertos
( Kulk e Loenen , 2012 )
Ameaça de processos judiciais ou outras violações. Por exemplo, privacidade
pode ser violado pelo uso de dados
(Janssen et al., 2012 )
Fragmentação de software e aplicativos
(Janssen et al., 2012 )
Nenhum software padrão para processamento de dados abertos
(Janssen et al., 2012 )
Existe uma falta de acordo sobre URIs para recursos, que podem
resultar em associações ausentes entre recursos durante
dificuldade de integração e consolidação da entidade
(O'Riain et al., 2012 )
O leitor pode não ser livre para fazer o que quiser com o texto
ou dados por causa de licenças
(Molloy, 2011 )
Os usuários devem cumprir as condições padrão quando desejam
use os dados
(Juiz, 2010 )
Problemas de design de banco de dados podem dificultar a transformação
conjuntos de dados
(Klerk, 2011 )
Os dados são disponibilizados apenas em formatos que são difíceis ou
caro de usar
(European_Commission, 2011b )
As condições para diferentes tipos de reutilização podem ser diferentes
(Janssen, 2011 )
O desenvolvimento de produtos de informação transfronteiriços e
serviços é prejudicado pelas muitas regras e práticas diferentes
no que diz respeito aos procedimentos e condições de reutilização.
Reutilizadores em potencial não sabem onde encontrar os dados
eles precisam, ou eles são confrontados com obscuros ou restritivos
condições sob as quais eles podem reutilizar os dados
(Janssen, 2011 )
Há falta de transparência sobre a disponibilidade de
documentos e as condições sob as quais eles podem ser re-
usava
(Janssen, 2011 )
Os dados podem não ser atualizados em tempo hábil ou são obsoletos e não
válido
(Lee e Kwak, 2012 , Janssen
et al., 2012 )
Os dados podem estar simplesmente incorretos, mas também informações essenciais
sobre os conjuntos de dados podem estar ausentes, como o período de tempo
em que os dados foram coletados.
(Janssen et al., 2012)
Falta de flexibilidade no formato de dados
(Lee e Kwak, 2012 )
Falta de precisão e atualidade dos dados.
(Lee e Kwak, 2012 , Janssen
et al., 2012 )
Os dados estão normalmente disponíveis como estão (ou seja, em formas heterogêneas
estruturas e formatos), exigindo uma carga de trabalho humana substancial
para limpá-los para processamento de máquina e torná-los
compreensível
(Ding et al., 2011 )
Tornar públicos apenas dados que não agregam valor
(Janssen et al., 2012)
Dados semelhantes armazenados em sistemas diferentes produzem resultados diferentes
(Janssen et al., 2012 )
Falta de infraestrutura eficaz com capacidade de computação suficiente
para processar grandes dados e melhores mecanismos sociais para
distribuir a carga de trabalho humana necessária para as partes interessadas
comunidades
(Ding et al., 2011)
A visão geral mostra que a maioria da literatura menciona apenas um número limitado de impedimentos e barreiras
e não houve um trabalho de visão geral, com exceção de ( Janssen et al., 2012) .
Como os impedimentos mencionados anteriormente são derivados da literatura, é interessante compará-los
com impedimentos derivados de outras fontes. Uma visão geral dos impedimentos derivados de
as entrevistas e workshops serão dados na seção seguinte e comparados com todos os
impedimentos que são mencionados na
Tabela 1.
1) Disponibilidade e acesso
Os dados não são coletados, especialmente dados detalhados.
Os dados não são publicados, pois as organizações mantêm esses dados para si.
Não está claro como obter uma licença para o uso de dados.
Os dados não estão disponíveis gratuitamente, uma (grande) taxa deve ser paga.
Os dados não são fornecidos continuamente; eles não são atualizados, de modo que o monitoramento não é
possível.
Os dados estão apenas parcialmente disponíveis.
Os dados estão disponíveis apenas para um determinado grupo de usuários (por exemplo, usuários comerciais,
pesquisadores ou organizações governamentais).
Nenhum compromisso de longo prazo com atualizações de dados por organizações fornecedoras de dados.
2) Encontrar habilidade
Os dados não podem ser encontrados.
Sem possibilidades de pesquisa avançada.
Os dados estão fragmentados. Não existe um portal central para os dados de que você precisa para estudos. X
Dificuldade em pesquisar e navegar devido à falta de índice ou outros meios para garantir
pesquisa fácil para encontrar os dados certos
Os dados estão ocultos em relatórios e não podem ser encontrados em um formato legível por máquina.
lado direito da tabela mostra se o impedimento foi derivado da literatura (L), das entrevistas
(I) e / ou as oficinas (W). Alguns impedimentos foram derivados de fontes múltiplas.
Tabela 3: Visão geral dos impedimentos de uso de dados sociotécnicos que influenciam o processo de dados
abertos
da perspectiva dos usuários de dados abertos.
Impedimento
eu
eu
C
3) Usabilidade
Preocupações com a confiabilidade da fonte.
X
Os dados podem estar incorretos ou faltam informações essenciais.
X
Falta de (domínio) conhecimento sobre como tratar os dados.
X
X
É necessário aconselhamento especializado para usar os dados.
X
X
Não está claro quais novos modelos de negócios devem ser pensados para o uso de dados abertos.
X
Falta de serviços prestados pelo provedor de dados para usar dados brutos.
X
Sem interoperabilidade de infra-estruturas de dados abertas com outros sistemas.
X
X
Os dados não são relevantes / interessantes.
X
X
Nenhuma explicação sobre as licenças aplicadas para dados abertos.
X
X
Ameaça de processos judiciais ou outras violações.
X
Os usuários são forçados a empregar várias transformações arbitrárias de dados para criar dados
utilizável e comparável.
X
Os dados requerem uma carga de trabalho humana substancial para serem limpos para o processamento da máquina
e para torná-los compreensíveis.
X
Fragmentação de software e aplicativos.
X
Nenhum software padrão para processamento de dados abertos
X
Sem tempo para se aprofundar nos detalhes, ou mesmo sem tempo.
X
Sem incentivos ou sem valor agregado para os usuários fazerem uso de dados abertos.
X
4) Compreender a habilidade
Os dados não são compreensíveis para o público em geral (por exemplo, relacionados ao jargão).
X
Nenhuma explicação sobre o significado dos dados.
X
Os dados não são visualizados.
X
Metadados não são visualizados.
X
Falta de conhecimento sobre como interpretar os dados.
X
X
Indisponibilidade de infraestrutura de suporte.
X
Falta de uma boa API.
X
Falta de habilidades e recursos para usar os dados.
X
X
Falta de conhecimento estatístico.
X
Os dados são fornecidos em um idioma que o usuário não entende.
X
Os metadados são fornecidos em um idioma que o usuário não entende.
X
Os conjuntos de dados não estão completos.
X
Nenhuma informação sobre a proveniência (contexto) dos dados.
X
X
Nenhuma informação sobre o intervalo de tempo (validade) dos dados.
X
Nenhuma informação sobre a validade dos dados.
X
Sem gerenciamento de versão, descrevendo quem fez o quê e quando os conjuntos de dados são
disponíveis, de modo que é difícil compreender os dados.
X
Nenhum suporte e / ou ajuda e / ou treinamento para o uso dos dados é fornecido.
X
X
5) Qualidade
Os dados não são confiáveis.
X
Nenhum conhecimento sobre se a classificação dos dados é confiável.
X
Difícil determinar a qualidade dos dados.
X
Os dados são limitados ou de má qualidade.
X
X
Baixa qualidade das ontologias.
X
Falta de precisão dos dados.
X
X
Os dados são frequentemente baseados em abordagens políticas e intuição, em vez de uma adequada
nível de inteligência.
X
É difícil medir a qualidade dos dados de saídas combinadas.
X
Depois de apresentar os principais resultados, discutimos as diferenças entre os impedimentos que são
mencionados por fontes diferentes e fornecem possíveis explicações para essas diferenças. finalmente, o
limitações desta pesquisa de impedimento são discutidas.
Vários impedimentos de acesso aos dados foram mencionados pelas diferentes fontes. Os impedimentos de acesso
foram divididos nas categorias
1) disponibilidade e acesso e
2) capacidade de encontrar. A maioria dos impedimentos
pertencia à primeira categoria. Os impedimentos mencionados por todas as três fontes são
1) os dados são
não publicado, pois as organizações mantêm esses dados para si e
2) os dados não estão disponíveis gratuitamente,
uma (grande) taxa deve ser paga. O fato de todas as fontes mostrarem esses impedimentos pode ser uma razão para
priorizá-los.
A maioria dos impedimentos para o processo de dados abertos diz respeito ao uso real de dados abertos. A análise
mostra que as políticas de dados abertos fornecem pouca atenção à perspectiva do usuário, enquanto o usuário precisa
para gerar valor a partir dos dados abertos. Os impedimentos de uso foram divididos nas categorias usabilidade,
compreender capacidade, qualidade, vinculação e combinação de dados, comparabilidade e compatibilidade e
metadados.
Um impedimento foi mencionado por todas as três fontes, a saber, o impedimento de que a corrente
o fornecimento de metadados é insuficiente. O fato de todas as fontes mostrarem esse impedimento pode ser uma
razão para
dar prioridade a este impedimento.
Os impedimentos de deposição foram divididos nas categorias de interação com o provedor de dados e
abrindo e enviando. Todos os impedimentos de deposição, exceto um, foram derivados da literatura. Nenhum
os impedimentos encontrados na literatura foram confirmados pelas entrevistas ou oficinas.
4.1.1 Diferenças de fonte
Analisando as Tabelas 2, 3 e 4, vemos que muitos tipos diferentes de impedimentos para os dados abertos
processo são mencionados na literatura, nas entrevistas e nas oficinas. A literatura frequentemente fornece
impedimentos de nível, enquanto nas entrevistas e workshops impedimentos mais detalhados foram
revelado. Isso mostra a complexidade de categorizar impedimentos, já que alguns deles são parcialmente
sobrepostos ou podem ser vistos como subconjuntos de outros. Por exemplo, criamos uma categoria separada para
impedimentos que estão relacionados à qualidade dos dados, mas impedimentos relacionados à qualidade também
podem ser
categorizado na categoria de usabilidade ou metadados.
O impressionante é que as fontes nem sempre se confirmam. A maioria dos impedimentos apresentados são
mencionado apenas por uma ou duas fontes, mas não por todas elas. A literatura forneceu muitos
tipos de impedimentos para as categorias de disponibilidade e acesso aos dados, usabilidade e abertura e
Enviando. Impedimentos nas categorias de capacidade de compreensão e metadados foram menos mencionados por
literatura. Durante a análise, notamos que os mesmos impedimentos sobre disponibilidade e acesso,
metadados e qualidade de dados foram mencionados por um grande número de fontes de literatura. Por exemplo,
impedimentos como os dados não são publicados, a qualidade é limitada ou pouco clara e insuficiente
metadados são fornecidos, foram mencionados em muitas publicações.
Os entrevistados mencionaram vários impedimentos para o uso de dados abertos em cada impedimento
categoria. Eles não se concentraram muito em uma categoria, embora impedimentos nas categorias
disponibilidade e acesso, capacidade de localização, vinculação e combinação de dados e metadados foram
ligeiramente mencionados
mais. Poucos impedimentos foram mencionados para as categorias compreender habilidade e abertura e
Enviando.
Tabela 4: Visão geral dos impedimentos de deposição de dados sociotécnicos que influenciam os dados abertos
processo da perspectiva dos usuários de dados abertos.
Impedimento
eu
eu
C
9) Interação com o provedor de dados
Nenhuma discussão entre o provedor de dados e o usuário de dados é possível.
X
X
Nenhuma plataforma ou mecanismo de participação disponível.
X
10) Abrindo e enviando
Dificuldades com o upload (reutilizado) de conjuntos de dados.
X
Ameaça de violação de privacidade ao publicar dados.
X
Ameaça de ser legalmente responsável quando os dados abertos são mal utilizados.
X
Falta de princípios orientadores e suporte para a abertura de dados.
X
Os sites aumentam as restrições aos formatos de dados para depósitos.
X
Os usuários são convidados a se registrar ou se tornar um membro do site.
X
A prática de depósito de dados atualmente ainda é limitada a uma minoria de pesquisadores
e o compartilhamento de dados está confinado a um número limitado de conjuntos de dados.
X
Não há mecanismos para garantir que os resultados de dados abertos sejam usados pelo governo.
X
Há uma falta de clareza sobre os termos de reutilização.
X
Existem procedimentos de licenciamento complicados ou taxas proibitivas.
X
Os sistemas legados complicam a publicação de dados.
X
Qualidade discutível de entrada do usuário.
X
As organizações públicas não reagem à entrada do usuário.
X
Nenhum processo para lidar com a entrada do usuário.
X
O processo de dados abertos não é visto como um processo de interação entre o
governo e o público.
X
O uso de dados abertos pode exigir transformações consideráveis do setor público
organizações.
X
Os funcionários públicos parecem ser amplamente dominados pelo foco no processo de publicação
e os desafios associados.
X
Não esperávamos encontrar impedimentos diferentes de fontes diferentes. Uma primeira explicação possível para
as diferenças de origem podem ser os diferentes objetivos e configurações da coleta de dados. Mais literatura
comunica uma certa ideia ou fornece argumentação para uma determinada afirmação e não tem como objetivo
fornecem uma ampla visão geral de todos os impedimentos para o processo de dados abertos. Mais literatura apenas
menciona alguns impedimentos de alto nível, mas não se concentra muito em impedimentos detalhados.
Impedimentos mencionados pela literatura foram frequentemente usados para introduzir um tópico e fornecer suporte
para
escrevendo um artigo. As entrevistas se concentraram na obtenção de informações mais aprofundadas sobre
impedimentos para o uso de dados abertos e metadados e informações básicas relacionadas. O
workshops com o objetivo de discutir exaustivamente e obter feedback sobre certas ideias, como
infraestruturas de dados. Em todas as oficinas, pelo menos uma apresentação foi feita sobre o uso de dados abertos,
que estimulou os participantes a fazerem perguntas sobre este uso no contexto da apresentação e
discuta-o depois, às vezes com base em várias declarações. Isso pode ter resultado em um
certo preconceito em relação às questões apresentadas ou abordadas pelo apresentador. O contexto do
vários workshops podem ter sido diferentes. O workshop forneceu um contexto específico em que o
impedimentos foram mencionados. Eles só podem ser aplicáveis nesse contexto.
Além disso, os entrevistados e os participantes das oficinas eram principalmente acadêmicos. O
impedimentos que são fornecidos na literatura não vêm apenas de acadêmicos, mas também de
profissionais e formuladores de políticas. Pessoas com experiências diferentes podem ter perspectivas diferentes
em impedimentos de dados abertos.
As diferenças entre os impedimentos que foram encontrados na literatura atual e os impedimentos
que foram encontrados na pesquisa empírica pode ser parcialmente devido ao fato de que a literatura não paga
atenção para fornecer uma visão geral estruturada dos impedimentos. Além disso, os impedimentos de dados abertos
são
provavelmente mudará com o tempo, pois no passado um impedimento poderia ser não ter uma única loja para
publicar
dados abertos, enquanto hoje em dia a maioria dos países introduziu um portal de dados abertos para publicar seus
dados. Além disso, no passado, a disponibilidade de conjuntos de dados pode ser um problema, enquanto hoje em dia
mais
e mais dados estão disponíveis. No entanto, espera-se que uma revisão da literatura mais completa tenha resultado
em mais repetição dos mesmos impedimentos em vez de uma extensão dos impedimentos que foram
encontrado, como muita repetição de impedimentos já foi encontrada em nossa visão geral da literatura atual.
Portanto, podemos concluir que os impedimentos encontrados na literatura eram incompletos e que nossa
tabela que inclui literatura e pesquisa empírica é mais abrangente.
Outra possível explicação para as diferenças de impedimentos que foram mencionados por diferentes
fontes podem ser o fato de que o campo de dados abertos é relativamente novo. Como não é muito sistemático
a pesquisa foi realizada no campo de dados abertos, nenhuma visão geral abrangente de impedimento pode
ser derivado da literatura.
4.3 Limitações
Na introdução, argumentamos que a criação de uma visão geral dos impedimentos sociotécnicos é relevante,
como uma ampla visão geral desses impedimentos do processo de dados abertos pode fornecer
conhecimento sobre quais impedimentos existem atualmente. As seções anteriores mostraram quais
impedimentos que derivamos da literatura, entrevistas e workshops. No entanto, identificando todos
impedimentos é difícil por várias razões. Em primeiro lugar, a busca por literatura de dados abertos fornece
resultados consideráveis em máquinas de busca online e nem todos esses resultados puderam ser examinados. Além
disso,
durante as entrevistas e workshops podem ter sido mencionados impedimentos que foram interpretados em
de uma forma diferente daquela que os participantes pretendiam dizer ou eles podem nem ter sido notados.
Além disso, outras fontes, como questionários e grupos de foco e outros grupos de dados abertos
usuários, como desenvolvedores e jornalistas, podem fornecer ainda mais ou outras informações de impedimento.
Além disso, os impedimentos podem se sobrepor. Portanto, é difícil avaliar se o impedimento
a visão geral apresentada neste artigo está completa. Além disso, os impedimentos têm diferentes
níveis de abstração, às vezes são de alto nível, enquanto em outras situações são muito detalhados.
Este é um dos motivos pelos quais é difícil comparar a literatura com nossa pesquisa empírica.
Na introdução, foi afirmado que uma visão geral dos impedimentos sociotécnicos poderia nos ajudar
identificar quais desafios devem ser enfrentados por políticas e estratégias de dados abertos. O
visão geral de impedimentos mostra quais impedimentos foram mencionados por todas as fontes e poderiam ter
prioridade
em políticas e estratégias de dados abertos. No entanto, a visão geral do impedimento não mostra quantos
vezes um certo impedimento foi mencionado por uma fonte. Por exemplo, um impedimento pode ter
foi mencionado em dez publicações de literatura, mas nunca durante as entrevistas ou workshops. No
visão geral do impedimento este impedimento pode parecer não ser muito importante, embora a literatura tenha
mostrado que é importante. Essas limitações devem ser levadas em consideração na interpretação do
visão geral do impedimento.
5. Conclusões
O valor potencial dos dados abertos é enorme. No entanto, percebendo efeitos positivos e
criar valor público com o uso de dados abertos em grande escala parece ser muito ambicioso neste
momento, como o processo em que os dados são publicados, encontrados, usados, vinculados, reutilizados e
discutidos,
que é aqui referido como o processo de dados abertos, encontra muitos impedimentos que impedem ou
bloquear a publicação ou uso de dados abertos. Apesar de sua importância, nenhuma visão ampla do
impedimentos sociotécnicos do processo de dados abertos estão disponíveis a partir da perspectiva do
usuário de dados.
Com base em uma visão geral da literatura (37 documentos), quatro workshops e seis entrevistas, 118
foram identificados impedimentos técnicos para o uso de dados abertos. A análise mostrou que
atenção é dada à perspectiva do usuário, enquanto o usuário precisa gerar valor a partir do
dados. Os impedimentos que o processo de dados abertos encontra atualmente foram categorizados em dez
categorias: 1) disponibilidade e acesso, 2) capacidade de encontrar, 3) usabilidade, 4) capacidade de compreensão, 5)
qualidade, 6)
vinculação e combinação de dados, 7) comparabilidade e compatibilidade, 8) metadados, 9) interação com o
provedor de dados e 10) abertura e upload.
Os impedimentos provavelmente mudarão com o tempo. Novas políticas e infraestruturas provavelmente resolverão
muitos dos
os impedimentos atuais, e devido a novas e maiores expectativas, novos impedimentos podem surgir
Tempo. Por exemplo, uma única loja de dados abertos era um obstáculo alguns anos atrás, mas dificilmente é
hoje em dia, visto que a maioria dos países estabeleceu um portal de dados abertos. Diferentes tipos de impedimentos
foram derivados de diferentes fontes. Diferenças também foram encontradas dentro do mesmo tipo de fonte. No
Além disso, concluímos que os impedimentos que foram encontrados na literatura diferiam dos impedimentos
que foram encontrados em pesquisas empíricas. Os impedimentos encontrados na literatura podem ter sido
incompletos
e nossa visão geral dos impedimentos derivados da literatura e da pesquisa empírica é
mais abrangente. A visão abrangente dos impedimentos pode ser usada como base para
melhorar o processo de dados abertos para que efeitos positivos possam ser realizados. Mais pesquisas deveriam ser
realizada para avaliar se outras fontes e outros grupos de usuários fornecem mais ou outros
informações de impedimento, para avaliar a importância dos impedimentos individuais e examinar
se certos impedimentos atrapalham o processo de dados abertos mais do que outros.
6 Agradecimentos
Este artigo está relacionado ao Projeto de Infraestrutura ENGAGE FP7 (An Infrastructure for Open, Linked
Provisão de dados governamentais para comunidades de pesquisa e cidadãos). Os autores gostariam
agradecer a seus colegas do projeto ENGAGE por suas contribuições para este artigo, embora as opiniões
expressas são as opiniões dos autores e não necessariamente do projeto. Além disso, os autores
gostaria de agradecer a todas as pessoas que forneceram informações sobre os impedimentos do processo de dados
abertos
durante as oficinas e entrevistas