Escolar Documentos
Profissional Documentos
Cultura Documentos
Usos e aplicações de jornalismo guiado por dados: um estudo do jornal O Estado de São
Paulo
Resumo: Este artigo visa elucidar a prática do jornalismo guiado por dados exercido pelo
Jornal O Estado de São Paulo. Após discussão teórica sobre conceito de Big-Data e
jornalismo de dados, é apresentado um estudo de caso realizado a partir do blog Estadão
Dados. Além de descrever as etapas que antecedem a busca pelos dados online, foi possível
verificar os principais temas alvos de uso de jornalismo guiado por dados. O trabalho também
aponta de que maneira o resultado final da busca por dados são apresentados nas reportagens
e apresenta quais são os conhecimentos e técnicas necessárias para ser um jornalista de dados.
Palavras-chave: Jornalismo guiado por dados; Big Data; O Estado de São Paulo; Estadão
Dados.
Introdução
Trabalhar com dados não é uma novidade na realidade do jornalista, cuja rotina
também inclui lidar com planilhas e gráficos, como é possível visualizar na reportagem do
jornal The Gaurdian de 1821. A matéria relacionava escolas da cidade de Manchester, na
Inglaterra, com o custo que cada aluno representava, o que acabou revelando que o número de
estudantes que recebia educação gratuita era maior do que aqueles que os dados oficiais
mostravam.
1
Pós-graduanda em Gestão de Conteúdo em Comunicação pela Universidade Metodista de São Paulo.
E-mail: gabirm@gmail.com.
2
Assim, a quantidade de dados que são produzidos e armazenados deu um salto, como é
possível visualizar na Figura 2, a qual prevê que em 2020 haverá 40 mil exabytes3 de dados
no mundo.
2
Big Data é a era em que a base tecnológica oferece possibilidades de novas configurações ao jornalismo.
3
Unidade de medida de informação em que 1 EB equivale 1.000.000.000.000.000.000 Bytes (segundo SI).
3
Outro impulso ao jornalismo de dados veio dos governos, que passaram a adotar uma
postura mais aberta, liberando dados de interesse público. No Brasil, a L ei de Acesso4 à
Informação entrou em vigor em maio de 2012, facilitando o acesso dos cidadãos a dados
públicos disponíveis no espaço virtual. A diversificação de ferramentas digitais gratuitas
também contribui para consolidar a prática da descoberta dos dados, já que permitiu que o
entrave das barreiras técnicas fosse superado, como salienta Crucianelli:
Mas a necessidade de revelar os dados surgiu muito antes. Conforme revela Trasel
(2014), a importância de disponibilizar esse tipo de informação vem desde a década de 1960,
com a ideia do jornalismo de precisão, passando por Reportagem Assistida por Computador
(RAC), na década de 1990, e evoluindo para o que conhecemos hoje como Jornalismo Guiado
4
Lei nº 12.527, de 18 de novembro de 2011.
4
Diante do cenário, este trabalho busca mostrar de que forma este tipo de jornalismo é
apropriado para o jornal. A intenção é esclarecer quais são os temas alvos de usos de dados
pela equipe, de que maneira eles conseguem dados reveladores sobre esses temas, que tipo de
ferramentas digitais são utilizadas. Para tanto, o trabalho busca estruturar e analisar os dados e
como são apresentados os resultados destas buscas.
Passado a fase de adaptação inicial, o jornalismo produzido para a web vive sua
terceira fase, onde já há produção específica para o meio, com linguagem e ferramentas
adaptadas a essa nova realidade (MIELNICZUK, 2003).
No início dos anos 70, o termo jornalismo de precisão foi cunhado para
descrever esse tipo de apuração jornalística: ‘o emprego de métodos de
pesquisa das ciências sociais e comportamentais na prática jornalística’ (em
The New Precision Journalism de Philip Meyer). O jornalismo de precisão
foi proposto para ser praticado nas instituições jornalísticas convencionais
por profissionais formados em jornalismo e em ciências sociais. Nasceu
como resposta ao ‘New Journalism’, que aplicava técnicas de ficção à
reportagem. Meyer defendia que eram necessários métodos científicos para
coleta e análise de dados, em vez de técnicas literárias, para permitir que o
jornalismo alcançasse sua busca pela objetividade e verdade (GRAY, J. et
al, 2013, p.04).
Deste modo, Araújo (2016) propõe que o que diferenciava o jornalismo de precisão do
trabalho realizado atualmente pelo jornalismo de dados é o uso do computador como
ferramenta de apuração jornalística. Segundo o autor (2016, p.154): “intrinsicamente, não
6
existentes divergências entre elas porque ambas as práticas baseiam-se na busca por nomes,
números e outros tipos de mensagens que estão presentes na realidade”.
No Brasil, o jornalismo guiado por dados teve início por volta dos anos 2000, quando
jornalistas, de maneira independente, começaram a se utilizar de técnicas computacionais para
balizarem seus trabalhos. De forma institucionalizada, o jornalismo guiado por dados teve
inicio no país com O Estado de São Paulo, em maio de 2012, quando foi criado o Estadão
Dados.
Importante destacar que o surgimento de iniciativas de jornalismo guiado por dados no
Brasil tiveram aporte, em grande medida, com a promulgação da Lei de Acesso a Informação
que trouxe mais transparência aos órgãos públicos brasileiros. Assim, segundo Araújo (2016),
o jornalismo guiado por dados só é possível de ser feito, de forma satisfatória, a partir da
disponibilização de dados na web, possível a partir da Lei de Acesso a Informação.
Visando esboçar uma metodologia de coleta e análise de dados que permita entender
como é praticado o jornalismo de dados do jornal O Estado de São Paulo, realizou-se uma
coleta de todas as matérias já reproduzidas nas páginas do blog Estadão Dados, desde o
primeiro dia de seu lançamento, em 6 de junho de 2011. Totalizou-se 256 matérias, que foram
analisadas conforme a editoria pertencente, o jornalista que a postou (escreveu), qual
categoria ela foi inserida dentro da lógica de publicação do blog (permanente, gráfico do dia,
séries especiais, explicador, política, eleições 2014), que tipo de ferramenta de visualização
foi usada (através apenas da indicação do blog), e qual fonte de dados foi utilizada (também,
neste caso, quando havia a indicação).
Fazer isso todo dia não é fácil, é mais complicado do que parece, mas
felizmente a gente tem conseguido manter a regularidade diária desde que o
blog foi criado e eu acho que está surtindo muitos efeitos positivos, porque a
7
Mapeando a editoria que mais se destaca no blog, constatou-se que Política está na
dianteira, com 35,5% das matérias publicadas. Não por menos, já que este é o assunto de
maior relevância dentre as demais editorias de um jornal. Segundo, Lima (2006) a
centralidade da política para a mídia ocorre porque é através dos meios de comunicação que a
política nacional acontecesse. O mass média acaba, nesta visão, exercendo várias funções
tradicionais dos partidos políticos, agendando temas e interferindo em eleições.
Neste sentido, o blog Estadão Dados apresentou uma variedade de formatos, textos,
fotos, infografia, mapas, etc, perfazendo a disponibilidade de recursos existentes no atual
contexto. A ferramenta mais recorrente utilizada pelo blog Estadão Dados foi a Infogram.
Segundo Seymat afirma no Blog do Inforgram, a ferramenta traz uma grande oportunidade
para fazer gráficos e mapas relevantes de modo a trazer vida a histórias.
Entretanto, a visualização em gráficos ou mapas não parece ser o foco da equipe já que
ela se debruça nos dados com o objetivo maior de extrair informação relevante, o que pode
desdobrar em matérias e/ou pautas para outras editorias do jornal, sem a necessidade absoluta
de haver a visualização representada no Blog, conforme explica Toledo:
5
O editor CartoDB é uma ferramenta de mapeamento self-service que mapeia e analisa ferramentas
que combinam uma interface intuitiva com recursos de descoberta poderosos. Mistura e combina seus
conjuntos de dados para obter novos insights sobre suas visualizações.
9
De outra maneira, detectou-se que em alguns casos a visualização dos dados não é
clara ou traz erros. Assim, ao invés de organizar a informação, a história contada pela
visualização se tornava complexa ou desorganizada. Na figura 5 não é possível abrir todo o
gráfico de uma vez, sendo preciso rodar a barra de rolagem para acompanhar os dados, o que
acaba por dificultar a compreensão dos mesmos.
De outra maneira, em alguns casos, como na figura 6, a página apresenta erro, ficando
impossível perceber a informação que se pretendia passar.
10
Foram utilizadas 51 fontes diferentes, sendo que a que mais apareceu nas matérias foi
o Ibope. O uso expressivo desta fonte pode justificar-se devido ao fato do órgão trazer
pesquisas sistemáticas e relevantes sobre diversas categorias, desde opinião, mercado,
comportamento, consumo, serviços de telefonia etc.
Ainda segundo o Gray, com a fonte de dados disponibilizada, cada usuário pode tomar
para si a tarefa de investigar e se aprofundar no tema, democratizando a informação.
Com relação à fonte dita como Internet, relacionou-se as matérias que foram
originadas a partir de informações do Twitter ou Google, como exemplificado na figura 7.
11
Outra fonte que vale mencionar é o Basômetro que é uma “ferramenta interativa que
permite medir o apoio dos parlamentares ao governo e acompanhar como eles se
posicionaram nas votações” (BLOG ESTADÃO DADOS, 2016). Além disso, a ferramenta é
constantemente atualizada, o que permite usá-la permanentemente e de diversas maneiras. E é
a partir desta possibilidade que ela é utilizada em algumas matérias do blog Estadão Dados,
conforme aponta figura 8.
6
Segundo Zago (2008) microblog é “parte da idéia de um blog (atualizações em ordem cronológica inversa,
possibilidade de comentários e trackbacks, blogroll), mas apresenta como singularidade o fato de que é adaptado
para postagens de tamanho reduzido”.
12
Vale destacar que alguns posts do blog somente havia um texto explicativo de como
foi elaborada determinada matéria. Como pode-se visualizar no exemplo da figura 11.
Ao abrir este tipo de espaço, o blog Estadão Dados está alfabetizando seu leitor de
modo a fazê-lo compreender como funciona esta nova lógica informativa, segundo a qual, o
usuário tem o poder de narrar à história para si próprio. Em linha, Gray (2013) traz reflexão
de Liliana Bounegru sinalizando que a disponibilização da fonte de dados nas matérias
permite expandir o conhecimento do leitor sobre o assunto já que ele pode mergulhar nestes
dados, fazendo novas descobertas:
Em outros casos, o texto fazia referência apenas a uma série especial que o Estadão
Dados estava lançando, de modo a propagandear as ações da equipe de Dados (Figura 12).
jornalístico, até a busca dos dados, limpeza, análise e visualização. Além disso, questões
como impossibilidade de visualizar as matérias por erros na página ou mesmo gráficos que
não carregavam configuraram uma barreira na análise (Figura 12).
Conclusão
Neste cenário, vislumbra-se o uso de diversas técnicas para apuração jornalística, com
uso de uma gama de dados. Atrelado a este fator, verificou-se que o Estadão diversifica a
temática das reportagens baseada em dados potencializando assim o eixo temático geralmente
utilizado, o que colabora para uma maior densidade informativa, assegurando a oferta efetiva
de conteúdos originais.
Quanto às fontes, nota-se que não há fontes humanas, somente dados. Pode-se supor, a
partir disso, que há uma crença de que os dados são mais confiáveis e seu uso representa a busca
pela confiabilidade das informações.
Não obstante, percebe-se que, ao explicarem uma matéria, o Blog Estadão Dados
convida os leitores a realizar uma auditoria sobre todo o processo jornalístico. Da mesma
forma, concede o controle da narrativa na medida em que isso permite ao leitor fazer sua
própria interpretação dos dados.
16
Outra variável da análise diz respeito à remissão das fontes utilizadas nas matérias.
Elas não aparecem em 100% das matérias, mas quando presentes têm a missão de aprimorar a
credibilidade da informação. Destarte, sua função primordial é ampliar a transparência do
noticiário, para compensar o declínio na credibilidade depositada na imprensa pelo público.
A dinâmica da equipe de dados do Estadão se configura de modo cooperativo, embora,
em sua maioria, apenas um jornalista assina a matéria. Esta afirmação é baseada não só na
análise das matérias, como também por afirmação do responsável pela equipe, o jornalista
José Roberto de Toledo. Ademais, segundo Träsel (2014, p.155) “[...]pode-se dizer que a
maioria das matérias eram produzidas coletivamente pelo ED. Apenas Toledo costumava
apurar e redigir de forma independente, o que pode se dever ao fato de ser o coordenador e
repórter mais experiente do grupo”.
Uses and applications journalism guided by data: a newspaper study The State of São
Paulo
Abstract: This article aims to elucidate the practice of database journalism exercised by the
newspaper O Estado de São Paulo. After theoretical discussion on the concept of Big Data
and data journalism, a case study from Estadão Data blog is displayed. In addition to
describing the steps leading up to search for online data, we found the main targets issues of
journalism use guided by data. The work also shows how the final result of the search data is
displayed in reports and displays which are the knowledge and skills needed to be a data
journalist.
Referências
ARAÚJO, L. et al. Deep Web e Jornalismo: Como transformar dados desta rede anônima em
informação de relevância social. Sociedade Brasileira de Estudos Interdisciplinares da
Comunicação, São Bernardo do Campo. Anais...Pensacom, 2015. Disponível em:
http://portalintercom.org.br/anais/pensacom2015/resumos/032.pdf. Acesso 10 de mai. de
2016.
BARBOSA, S (org). Jornalismo Digital de Terceira Geração. Corvilha: LACCOM, 2007. 180
p.
BRASIL. LEI Nº 12.527, (18 de Novembro de 2011). Regula o acesso a informações previsto
no inciso XXXIII do art. 5o, no inciso II do § 3o do art. 37 e no § 2o do art. 216 da
Constituição Federal; altera a Lei no 8.112, de 11 de dezembro de 1990; revoga a Lei no
11.111, de 5 de maio de 2005, e dispositivos da Lei no 8.159, de 8 de janeiro de 1991; e dá
outras providências. Presidência da República, Casa Civil, Subchefia para Assuntos Jurídicos.
18
CRUCIANELLI, S. Ferramentas digitais para jornalistas. 2010. Editado pelo Centro Knight
para o Jornalismo nas Américas, da Universidade do Texas/Austin. Trad. Marcelo Soares.
Disponível em:<http://knightcenter.utexas.edu/hdpp.php>.
EMC CORPORATION. IMC Digital Universe.The Digital Universe in 2020: Big Data,
Bigger Digital shadows, and the Biggest Growth. Hopkinton, 2012. 16p. Disponível em
<https://www.emc.com/collateral/analyst-reports/idc-digital-universe-united-states.pdf>
Acesso e, 5 de jun. 2016.
GRAY, J. et al. Manual de jornalismo de dados. São Paulo: Abraji/EJC, 2013,. Disponível
em: http://datajournalismhandbook.org/pt/index.html. . Acesso: 13 de Jan. 2016.
LIMA, V de. Mídia: crise política e poder no Brasil. São Paulo: Perseu Abramo, 2006.
Machado, E. A base de dados como formato no jornalismo digital. In: ANTÓNIO FIDALGO
(e all). Visões Disciplinares – Covilhã: Universidade Beira Interior, 2005. Vol3, p. 297-302.
TOLEDO, J. R. Entrevista concedida a Gabriele Maciel. São José dos Campos, 17 jun. 2016.