Você está na página 1de 7

Melhores práticas na publicação de dados e

estatísticas na web
Resumo executivo

Pesquisa realizada nos EUA evidencia:

 67,5% dos cidadãos e 92,6% dos servidores acreditam que se os dados são públicos, eles devem estar
disponíveis online;
 Cidadãos estão mais propensos em votar, com uma margem de 3 para 1, em políticos que carregam a
bandeira da transparência de dados;
 Mais cidadãos acreditam que a transparência de dados é importante o suficiente a se financiar com recursos
públicos do que os que discordam (47% concordam contra 32,6% que discordam). Entre servidores públicos,
essa diferença é ainda maior: 82,4% concordam e 16,5% discordam;
 27% dos servidores que defendem a publicação citaram como principal obstáculo a falta de liderança ou
vontade política;
 Segurança pública aparece como categoria mais importante de dados a ser publicada segundo o cidadão;

Uma das boas práticas mais inovadoras identificada é permitir aos cidadãos que propaguem dados interessantes em
redes sociais como Facebook, Twitter e Blogs pessoais, criando um canal social de distribuição de dados e
informações governamentais.

Outra delas é a possibilidade de órgãos e entidades publicarem descentralizadamente seus dados, tornando-se por
iniciativa própria parte integrante de um sistema centralizado de informações governamentais.

Introdução

O presente trabalho buscou obter uma análise da disponibilização de dados e indicadores na web por diferentes
entidades governamentais, com o intuito de identificar melhores práticas adotadas. Inicialmente foram identificados
princípios desejados na publicação de dados e estatísticas, a partir dos quais se elencou critérios desejados a serem
seguidos.

Foram analisados os seguintes sites:

Data | World Bank (http://data.worldbank.org)

DATASUS (http:// http://www2.datasus.gov.br/DATASUS/index.php)

USAspending (http://www.usaspending.gov/)

GOOD Transparency (http://www.good.is/departments/transparency/)

OpenData | Socrata (http://opendata.socrata.com/)

Domínio Público Comunicação (http://www.dominiopublicocomunicacao.com.br/)

Banco de Dados de Indicadores Socioeconômicos do Ceará (http://cipp.ipece.ce.gov.br/mappav/vi/)

Fundação SEADE (www.seade.gov.br)


Melhores práticas: pesquisa de opinião
A empresa Socrata (www.socrata.com) realizou uma pesquisa de opinião sobre a situação atual de dados públicos
buscando três perspectivas: governo, público e desenvolvedores. A pesquisa foi realizada no Estados Unidos, com
representatividade para o país. Os principais resultados, apresentados a seguir, ajudam a identificar alguns dos
princípios desejados no desenvolvimento da publicação de indicadores.

Entre os resultados da pesquisa, destaca-se um grande suporte do público e de servidores do governo à dados
abertos na web: 67,5% dos cidadãos e 92,6% dos servidores acreditam que se os dados são públicos, eles devem
estar disponíveis online. Além disso, os cidadãos estão mais propensos em votar, com uma margem de 3 para 1, em
políticos que carregam a bandeira da transparência de dados. O GRÁF. 1 apresenta a opinião dos cidadãos quanto à
transparência de dados:

Concorda Discorda Incerto

Dados do governo são propriedade dos contribuintes e


devem ser livres a todos os cidadãos
67,9% 18,7% 13,4%

Em pleno século XXI, se os dados são públicos, então


devem estar disponíveis online
67,5% 19,8% 12,7%

É mais provável que eu vote em políticos que carregam a


bandeira da transparência de dados
61,% 19,3% 19,7%

Eu confiaria mais em meu governo se eles


disponibilizassem a maioria dos dados públicos online
56,3% 28,6% 15,1%

Transparência de dados é uma iniciativa importante o


suficiente a se financiar com recursos públicos
47,% 32,6% 20,4%

0% 20% 40% 60% 80% 100%

Gráfico 1 – Opinião dos cidadãos quanto à transparência de dados


Fonte: Benchmarking de dados públicos – Socrata.

Além disso, mais cidadãos acreditam que a transparência de dados é importante o suficiente a se financiar com
recursos públicos do que os que discordam (47% concordam contra 32,6% que discordam). Entre servidores
públicos, essa diferença é ainda maior: 82,4% concordam e 16,5% discordam. O GRÁF. 2 mostra a opinião dos
servidores:
Concorda Discorda Incerto

Dados do governo são propriedade dos contribuintes e devem


ser livres a todos os cidadãos
91,% 8,5%

Em pleno século XXI, se os dados devem ser públicos, então


devem estar disponíveis online
92,6% 6,4% 1,1%

Cidadãos confiariam mais em um governo se este


disponibilizasse a maioria dos dados públicos online
75,% 17,6% 7,4%

Transparência de dados é uma iniciativa importante o


suficiente a se financiar com recursos públicos
82,4% 16,5% 1,1%

0% 20% 40% 60% 80% 100%

Gráfico 2 - Opinião de servidores quanto à transparência de dados


Fonte: Benchmarking de dados públicos – Socrata.

Já quando perguntados sobre quais os maiores obstáculos à publicação de dados, 27% dos servidores que defendem
a publicação citaram falta de vontade políticas ou liderança como principal razão, seguido da ausência de
financiamento (19%) e de questões de privacidade e segurança (16,5%). O GRÁF. 3 apresenta estes valores:

30,%

25,%

20,%

15,%
27,0%
10,% 19,0%
16,5%
14,0% 12,5%
5,%
5,5% 5,5%
,%
Ausência de Financiamento Privacidade e Comprometimento Administração Qualidade dos Recursos técnicos
liderança ou Segurança interno inadequada dos dados disponíveis
vontade política dados

Gráfico 3 - Maiores obstáculos à publicação de dados governamentais


Fonte: Benchmarking de dados públicos – Socrata.

Com relação aos temais considerados mais importantes, aparecem nos primeiros lugares questões como segurança
pública, orçamento e finanças, e educação, conforme apresenta o GRÁF. 3:
Muito importante Importante Não relevante Nada importante Incerto

Segurança Pública 56,5% 28,% 6,% 7,%

Orçamento e Finanças 53,% 26,% 7,% 12,%

Accountability (ex. Financiamento de campanhas) 52,% 27,% 7,% 11,%

Educação 52,% 30,% 8,% 8,%

Serviços Governamentais 51,% 29,% 6,% 10,%

Legislativo (ex. Registro de votos) 48,% 26,% 11,% 12,%

Serviços (Consumo/preços de água, energia, gás) 44,% 38,% 8,% 8,%

Ambiental (ex. Qualidade do ar/água) 42,% 34,% 10,% 10,%

Censos (População, Economia) 34,% 36,% 14,% 11,%

Transportes (Tráfego) 34,% 37,% 16,% 8,%

Desempenho governamental (Metas do governo) 31,% 38,% 12,% 14,%

0% 20% 40% 60% 80% 100%

Gráfico 4 – Importância das diferentes categorias de dados segundo a opinião dos cidadãos
Fonte: Benchmarking de dados públicos – Socrata.

Já no que diz respeito à experiência online e contato com os dados, 2 a cada 3 respondentes preferem explorar e
interagir com os dados online a baixá-los em uma planilha. Segundo a pesquisa, baixar os dados (atualmente o maior
meio de consumo de dados do governo) é menos desejado do que explorar visualizações pré-processadas de dados
(37%) ou descobri-los por meio de interações em redes sociais e comunidades. Estas preferências podem ser
visualizadas na TAB. 1:

Tabela 1- Como o cidadão prefere acessar os dados do governo

Forma %
Explorar e interagir com dados online 63,%
Explorar gráficos e mapas pré-processados dos dados 37,%
Ver o que outros têm a dizer sobre os dados, e compartilhar a própria opinião 29,%
Baixar os dados e trabalhá-los em planilhas 16,%
Outra 2,%
Fonte: Benchmarking de dados públicos – Socrata.

Melhores práticas: princípios e critérios


Com o intuito de identificar as melhores práticas, buscamos elencar primeiro alguns princípios que devem guiar o
desenvolvimento da publicação de dados e indicadores. A partir de cada um desses princípios, buscamos observar
critérios desejáveis, observando as práticas adotadas nos sites pesquisados.

O princípio fundamental e mais evidente relacionado à publicação de dados públicos é a transparência, que informa
uma série de outros princípios e critérios, relacionados a seguir:
Efetividade: a oferta se adéqua à demanda da informação.

Para que haja efetividade na publicação dos dados e indicadores, as informações disponibilizadas devem atender às
reais necessidades do público interessado. Um critério interessante a se observar nesse sentido é se “Há um módulo
de sugestões que permita a cidadãos, jornalistas, pesquisadores e demais interessados propor e votar propostas
de novas informações a serem disponibilizadas?”. O cidadão propõe a disponibilização de novos dados e
indicadores, a força de sua proposta é mensurada por meio de votação aberta, e somente as propostas mais fortes
são implementadas.

Com um sistema de feedback, que cria estatísticas sobre o acesso aos dados disponibilizados, é possível observar se
as novas informações (e as antigas também) estão sendo acessadas e utilizadas. Caso haja pouco acesso a
determinadas informações em um período delimitado, elas são excluídas do site, retirando-se informações “lixo” e
reduzindo-se o custo de manutenção da base de dados. Assim mantêm-se apenas informações realmente
apropriadas pelo público, tornando-as fáceis de encontrar e utilizar. Nesse sentido, deve-se observar o critério “Há
um registro (estatística) de quais dados são populares e como eles estão sendo consumidos, por método de acesso
(visualizações online, downloads, API calls, embeds)?”.

Outro método interessante de obter informações sobre a demanda de informação são os sistemas de busca. “Há um
registro das tendências de busca que informam quais palavras-chave são mais populares?”. Em conjunto com
outras práticas de feedback, esse registro acaba com um processo de “adivinhações” a respeito das necessidades de
informação. Os administradores do site sabem quais informações o público busca e trabalha para disponibilizar
aquelas mais importantes.

Além disso, para que a oferta de informação seja efetiva, deve se verificar se “Há destaque em indicadores mais
relevantes?”. Com o feedback, é possível identificar as informações mais acessadas e torná-las mais fáceis de
encontrar, alinhando a oferta à demanda.

Quanto à facilidade de se obter as informações, um critério importante a se observar é o “número de


procedimentos de entrada para se obter as informações desejadas”. Quanto maior o número de cliques e
redirecionamentos realizados para se obter as informações principais, mais “escondidas” elas se encontram, ferindo-
se, ainda que parcialmente, o princípio da transparência.

Para que haja transparência, a disponibilização das informações deve ocorrer de modo que a audiência não-técnica
possa interagir intuitivamente com os dados online e compreendê-los facilmente. Para tal, é necessário que o
conteúdo esteja disponível na própria página, e não apenas para download. Além disso, é desejável também que
haja uma série de possibilidades de visualização dos dados, em diferentes tipos de gráficos como linhas, setores,
colunas, mapas e afins. Se implementadas estas possibilidades, é importante que haja processamento prévio dos
gráficos disponibilizados, de forma se evitar lentidão na exibição dos dados.

Por outro lado, como a disponibilização de dados se volta também a pesquisadores e acadêmicos, é desejável que se
possibilite o tratamento e análise de dados, discutidos a seguir.

Possibilitar tratamento e análise dos dados;

Se por um lado os indicadores devem estar disponíveis na própria web para atender à audiência não-técnica, é
desejável também que o download dos dados esteja disponível para atender aos pesquisadores. Para garantir que
haja transparência de fato das informações, é desejável não apenas que os dados consultados estejam disponíveis
para download, mas também a possibilidade de download completo do banco de dados, para que se estimule a
cooperação do público interessado na construção de conhecimento sobre as questões públicas.

É desejável também que estas informações sejam disponibilizadas em uma grande variedade de formatos (CSV,
JSON, PDF, RDF, RSS, XLS, XLSX, XML), que atendam aos diversos tipos de público dependendo do destino dado às
informações obtidas.
Para este tipo de público, é desejável também que haja informações adicionais sobre os indicadores, além dos
dados. Descrição, limitações, fonte, links para pesquisa e questionários que geram os dados são bons exemplos.

Aumentar alcance e exposição dos indicadores entre os cidadãos;

Este princípio pode ser incorporado à “efetividade a oferta se adéqua à demanda da informação”. Para sermos
efetivos na publicação dos dados, estes devem ter uma grande exposição entre os cidadãos. Um meio importante
de aumentar o alcance das informações disponibilizadas é permitir aos cidadãos que propaguem dados
interessantes em redes sociais como Facebook, Twitter e Blogs pessoais, criando um canal social de distribuição
de dados e informações governamentais.

Estimular a apropriação de dados e indicadores entre diferentes atores, assim como sua parceria
e participação na construção de conhecimento.

Para estimular a participação na construção do conhecimento, é desejável que o público possa fornecer
comentários e idéias sobre os dados, e que estejam visíveis à comunidade, de modo a se recuperar na sociedade
informações que de outra forma seriam ignoradas pela administração pública.

É interessante também que órgãos e entidades possam publicar descentralizadamente seus dados, tornando-se
por iniciativa própria parte integrante de um sistema centralizado de informações governamentais. Cada unidade
seria responsável por atualizar seus próprios dados, reduzindo-se assim o custo de recuperação do sistema. Com o
registro de feedback, unidades com baixo acesso podem ser desligadas do sistema, reduzindo-se custos de
administração.

Nesse sentido, seria desejável que estas unidades pudessem validar seus dados com uma assinatura digital,
garantindo sua integridade ao reconhecê-los como autênticos.

Além disso, outra idéia interessante seria uma seção com dados carregados pela própria sociedade. Esta
possibilidade aumentaria a apropriação do site pelo público interessado, pois cria um espaço para que possam dar
visibilidade frente à sociedade a indicadores que julgam importantes.

Correção e qualidade dos dados

Quanto à correção e qualidade dos dados, é importante que sejam disponibilizadas séries históricas consistentes,
não fragmentadas por ano ou local em sua visualização ou download, de forma a não se ferir o princípio da
transparência.

Além disso, deve ser possível e fácil ao público reportar problemas nos dados, como inconsistência nos números,
registros duplicados e dados existentes na fonte mas faltantes na série histórica. Trata-se de mais uma forma de se
garantir a qualidade dos dados com custos reduzidos de administração, pois além do governo, o próprio público
contribui para a correção das informações.

Sobre a tempestividade e atualidade dos dados disponíveis, é desejável também que haja um registro da data em
que foi adicionado o último dado da série. Com este registro, o público poderá identificar e reportar casos em que
existam dados mais recentes não inseridos no banco, contribuindo para que os dados disponibilizados estejam
sempre atualizados.

Sigilo

Questões de privacidade e segurança são uma das barreiras que podem impedir a publicação de dados do governo.
Para amenizar estas questões, é possível que conjuntos de dados sejam marcados como privados, compartilhados
seletivamente ou abertos ao público. Assim, informações que não interessem ao público podem ser compartilhadas
somente entre um grupo restrito de interessados.
Abrir API para reduzir custos e retirar barreiras para a comunidade de desenvolvedores,
aumentando as chances de que eles investiam mais tempo em produzir aplicativos que usam
dados do governo;

A publicação de dados em uma estrutura padronizada e aberta, bem documentada, permite o acesso programático a
dados e metadados de qualquer indicador ou banco disponível no site, facilitando o desenvolvimento de aplicativos,
pela comunidade, que usam os dados do governo.

Para incentivar a participação da comunidade de desenvolvedores, é possível constituir uma galeria promovendo os
últimos aplicativos criados pelo público.

Considerações finais

Os critérios elencados neste estudo são baseados em princípios considerados importantes na publicação dos dados e
indicadores públicos, por isso “é importante ou desejável que” não sejam ignorados no desenvolvimento de uma
plataforma de publicação.

Além disso, a implementação de uma série destes critérios reflete um trade-off entre qualidade e custos. Portanto, é
possível que alguns dos critérios discutidos sejam ignorados em razão de limitações de tempo ou recursos humanos
e financeiros, de acordo com a restrição orçamentária que se coloca.

Você também pode gostar