Escolar Documentos
Profissional Documentos
Cultura Documentos
PROPÓSITO
Conhecer o jornalismo de dados, não apenas em sua definição e contextualização histórica, mas com a
compreensão básica dos processos e rotinas de trabalho, permite que o interessado em processos
jornalísticos e na produção de notícia de maneira geral entre em um novo universo de análise da
realidade e descubra pautas de alto valor-notícia.
OBJETIVOS
MÓDULO 1
MÓDULO 2
INTRODUÇÃO
Como um marco que faz jus ao título de histórico para além de uma mera adjetivação vazia, o caso
Wikileaks é visto hoje como um divisor de águas no mundo do jornalismo de dados. Não apenas por
conta do impacto gerado na comunidade política, econômica e social internacional, mas também devido
ao volume gigantesco de informações que puderam ser extraídas a partir daquele vazamento de dados.
Não foram apenas números que vazaram, mas nomes e informações em uma planilha digital que
reverberaram a ponto de governos inteiros ou nações com estabilidade democrática se virem às voltas
com revelações bombásticas sobre assuntos como política e diplomacia.
A partir do conhecimento desse caso e do conceito de jornalismo de precisão, você conhecerá nesse
espaço de aprendizado e reflexão dois pilares do jornalismo de dados. A saber:
Uma apresentação do uso dos dados no trabalho jornalístico (por meio de uma discussão tecnológica,
pensando na relevância do armazenamento e do cruzamento de dados para o jornalismo).
Uma discussão sobre a produção de notícia a partir de bancos de dados (no sentido organizativo e de
criação de novas competências e editorias do campo jornalístico).
No contexto de avanços tecnológicos constantes (de forma localizada não só no polo da produção, mas
também da recepção), o volume de dados criados e disponíveis no espaço on-line torna-se monumental.
Dessa forma, pensando em uma introdução ao jornalismo de dados, é preciso compreender como esses
dados acompanham a evolução das tecnologias, os processos de armazenamento, os critérios
organizativos para a criação de planilhas digitais editáveis e, finalmente, porque o cruzamento de dados
é essencial para o jornalismo hoje.
MÓDULO 1
Os pesquisadores Christofoletti e Oliveira (2011) sintetizaram com primazia o eixo central do que foi o
Wikileaks:
Na base de tudo isso, e como figura de destaque no epicentro do terremoto informativo que abalou o
mundo, estava Julian Assange. Considerado como uma mistura de hacker e jornalista (às vezes
assinalado como hacker-journalist), em 2006 o ativista Julian Assange fundou a Wikileaks como uma
plataforma on-line sustentada pela disseminação da filosofia hacker de que “a informação quer ser livre”,
como rememora Moura (2018, p. 28).
Tal organização, apresentada como sem fins lucrativos, conseguiu tornar públicos centenas de milhares
de documentos referentes à atuação dos EUA na política externa, em casos como a guerra do
Afeganistão e do Iraque, por exemplo. Desse modo, temas sensíveis e de extrema importância, que
estariam até hoje em completo sigilo, foram desnudados ao público por meio dos dados dessa
plataforma e das narrativas jornalísticas que os formataram enquanto notícias e grandes reportagens
especiais ao redor do planeta.
O termo foi cunhado pelo pesquisador Everette E. Dennis, no inverno de 1971, como parte de um
seminário da Universidade de Oregon. Mas foi por meio do pioneirismo de Philip Meyer, um prestigiado
jornalista e professor emérito na Universidade da Carolina do Norte, em Chapel Hill (Estados Unidos),
que a expressão ganhou o mundo.
Em seu livro Precision Journalism: A Reporter's Introduction to Social Science Methods (Em tradução
livre, Jornalismo de Precisão: uma introdução de um repórter aos métodos sociais), publicado pela
primeira vez em 1973, Meyer defende a aproximação entre jornalismo e técnicas de pesquisa
quantitativa das ciências sociais.
Nas palavras de Rodrigo Menegat, que entrevistou Meyer, “o livro é, em sua maior parte, um manual
para jornalistas — tradicionalmente avessos a disciplinas como matemática e estatística — trabalharem
com números” (MENEGAT, 2016, p. 168).
Portanto, fazendo uma conexão entre o pensamento pioneiro de Meyer e o jornalismo de dados
contemporâneo, podemos nos voltar ao exemplo do Wikileaks, em que a precisão era fundamental para
manter a legitimidade, a confiabilidade e a credibilidade dos dados vazados que seriam transformados
em matéria noticiosa.
PROSUMER
Producer + consumer, ou seja, produtor e consumidor, em inglês. A figura do consumidor de mídia, que
também a produz, tem gerado inúmeras discussões e novas percepções em diferentes campos do
saber.
EXEMPLO
Você pode até não se lembrar, mas sempre houve uma limitação muito restrita aos bens de consumo
para que o receptor tivesse à mão uma quantia finita muito específica de dados. No campo da música,
por exemplo, ao ter acesso a um disco de vinil, uma fita cassete, um CD, um DVD ou mesmo um
aparelho do tipo iPod (mp3), ainda assim sabíamos quantas músicas poderiam “caber dentro” desses
suportes/dispositivos.
E, ainda que saibamos que as possiblidades de armazenamento e compactação de conteúdo tenham se
transformado do vinil ao mp3, é no arquivamento de dados em nuvem que encontramos possibilidades
quase infinitas de armazenamento de sons, textos, imagens, vídeos etc.
Um ponto muito importante nesse cenário é justamente como os dados (para além de estarem se
multiplicando nos dias correntes) também têm trazido a possibilidade cada vez mais crescente de uma
organização e sistematização vinculada ao uso jornalístico das informações virtuais.
Dessa forma, como a internet está em toda parte e diante da imensa produção de dados estimulada
pelas tecnologias da informação, surge o big data, as bases de dados que podem ser explicadas como
modelo de sistematização de coleta e armazenamento de informação.
Assim, percebemos que o jornalismo de dados caminha lada a lado com a evolução tecnológica:
“seja do ponto de vista da gestão das informações, seja do ponto de vista do armazenamento e
recuperação dos dados e, sobretudo, como um suporte para novos modelos de estruturação de
narrativas”, como afirma Machado (2004, p. 303).
PLANILHAS DIGITAIS
As planilhas de dados em papéis ou outros formatos físicos (pré-Excel ou outras formas de edição de
planilhas digitais) já são usadas há muito tempo no campo jornalístico, de acordo com o jornalista e
pesquisador da Birmingham City University (Reino Unido) Paul Bradshaw.
Segundo ele, há vinte anos trabalha-se com planilha de dados, e essa era praticamente a única forma
de obter valor no cruzamento de dados. Porém, “nós vivemos em um mundo digital agora, um mundo no
qual quase tudo pode ser — e quase tudo é — descrito em números” (GRAY, BOUNEGRU,
CHAMBERS, 2012 apud LIMA JUNIOR, 2012, p. 212).
DICA
Como recorda Araújo (2016), trazendo de volta Paul Bradshaw ao centro do debate, é recomendado que
“[…] o jornalista tenha conhecimento especializado para realizar certas tarefas. […] Ele [Bradshaw]
sugere noções de estatística para compreensão de planilhas, material básico nesse novo setor do
jornalismo baseado em números e outras informações compiladas em forma não textual” (ARAÚJO,
2016, p. 156).
A partir do domínio das planilhas Excel, ficou clara a importância do software de gerenciamento de
planilhas na resolução de tarefas intrínsecas ao jornalismo de dados.
EXEMPLO
Podemos indicar outro grande marco nesse tipo de jornalismo a partir da primavera de 2010,
começando com nada mais nada menos que uma planilha: 92.201 linhas de dados, cada uma contendo
detalhes de uma ação militar no Afeganistão: os war logs (registros de guerra) liberados pelo WikiLeaks.
As planilhas digitais foram essenciais ao processo de organização dos dados vazados à imprensa e que
tomaram conta dos noticiários do mundo todo, como lembram Jonathan Gray, Liliana Bounegru e Lucy
Chambers (2012).
Por fim, a estruturação das planilhas deve seguir a direção oferecida pela pirâmide invertida do
jornalismo de dados, como mostra a imagem. Nela, é possível perceber que o passo a passo deve
cumprir a seguinte ordem de ação.
Não é demais recapitular que a finalidade de todo o processo é comunicar. Assim explica Isabella Moura
(2018, p. 23), é que, no ato de comunicação, “socializar os dados no jornalismo pode significar a
transferência de autonomia para o público, ao fornecer os dados e permitir que parta deles a indicação
dos pontos de interesse”.
É necessário observar que na última etapa, a da comunicação, os dados ainda podem ser subdivididos
em seis níveis partindo da base. São eles:
UTILIZAÇÃO
PERSONALIZAÇÃO
HUMANIZAÇÃO
SOCIALIZAÇÃO
NARRAÇÃO
VISUALIZAÇÃO DOS DADOS
Como Martinho (2014) assinala de antemão, interessa-nos procurar não apenas uma definição
consensual, única e exclusiva do que se trata o jornalismo de dados, mas entender que esse campo é
formatado por pilares estruturais que, paradoxalmente, são sólidos, mas passam por transformações
constantes e muito ágeis.
Assim, como primeiro movimento em busca de definição conceitual, vale observar que:
Por sua vez, Mancini e Vasconcellos (2016), ao tratar do tema, falam que a conceituação do campo
jornalístico baseado em dados deve procurar voltar seu foco para perceber as linhas tênues que
aproximam o jornalismo investigativo do jornalismo de dados. Segundo os autores, pesquisadores e
jornalistas que utilizam o JD adotam uma visão que associa a capacidade investigativa às novas
possibilidades da tecnologia.
A tabela a seguir, produzida por Moura (2018), busca dar corpo à visualização oferecida pelas reflexões
sobre como a conceituação de jornalismo de dados perpassa outras áreas que não necessariamente
surgiram agora, mas que vêm sendo trabalhadas ao longo do tempo nas rotinas produtivas jornalísticas:
JORNALISMO DE BASE DE DADOS =
JP + JI + JP+ RAC + JA + VOLUME DE DADOS +
VISUALIZAÇÕES + PROGRAMADOR
Avançando na direção de construir mais fronteiras (na lógica de aglutinação e não de exclusão), Moura
(2018) procura demonstrar que o jornalismo de dados vai além do jornalismo investigativo. Para a
autora, o jornalismo de base de dados (ou simplesmente jornalismo de dados em sua forma mais
encurtada) é resultado direto das áreas fronteiriças que se tocam, se misturam e acabam por trazer
novas produções de sentido na esfera da adjunção (ou seja, não necessariamente jornalismo em
profundidade é o mesmo que jornalismo de dados, mas suas bases são semelhantes, se afetam,
caminham de modo adjunto).
RESUMINDO
Uma definição possível (mas, novamente, não exclusiva) é que o jornalismo de dados pode ser lido
como um termo que abrange um conjunto cada vez maior de ferramentas, técnicas e abordagens para
contar histórias. Ele pode incluir tudo, desde reportagens assistidas por computador (RAC), usando
dados como fonte, até a visualização de dados mais avançada e aplicativos de notícias. O objetivo
unificador é jornalístico: fornecer informações e análises para ajudar a nos informar sobre
questões importantes do dia.
JORNALISMO DE DADOS
Os jornalistas Marcelo Soares e Catharina Epprecht conversam sobre o jornalismo de dados. Clique
para assistir!
VERIFICANDO O APRENDIZADO
MÓDULO 2
ATENÇÃO
Dessa forma, podemos pensar que o cruzamento de dados é elemento essencial para um
jornalismo de dados que se pressupõe ser inovador.
Ao compreendermos que o jornalismo de dados tem sua conceituação por limiares que tocam
em outros pontos da produção noticiosa (como o jornalismo de precisão), torna-se necessário
discutir de que forma os bancos de dados podem ser úteis ao debate sobre três pontos
interconectados:
RESPOSTA
Em grande parte, são as novas possibilidades que se abrem quando você combina o tradicional “ter
faro para notícias”, e a capacidade de contar uma história convincente, com a escala e a variedade de
informações digitais agora disponíveis por meio dos bancos de dados.
Como afirmam Manovich (2001) e Barbosa (2004), é preciso pensar os bancos de dados como
uma nova metáfora sintetizadora das formas culturais que perpassam a construção da notícia e,
de modo integrado, o próprio cotidiano de milhares de pessoas que lidam consciente ou
inconscientemente com um volume de dados quase incomensurável. Assim:
O jornalismo de dados pode ajudar um jornalista a contar uma história complexa por meio de
infográficos envolventes ou pode ajudar a explicar como uma história se relaciona a um
indivíduo.
DICA
Os dados podem ser a fonte do jornalismo de dados, ou podem ser a ferramenta com a qual a
história é contada — ou podem ser ambos. Como qualquer fonte, deve ser tratada com ceticismo;
e, como qualquer ferramenta, devemos estar cientes de como ela pode moldar e restringir as
histórias. Por isso, bancos de dados devem ser inteligentes e dinâmicos.
Antes de tudo, um banco de dados é uma coleção organizada de dados geralmente armazenados
e acessados eletronicamente a partir de um sistema de computador. Bancos de dados mais
complexos costumam ser desenvolvidos a partir de técnicas de modelagem e design formal.
ATENÇÃO
Machado (2004) ressalta que é preciso cuidado ao lidar com os bancos de dados no campo
jornalístico para não correlacionarmos automaticamente a ideia de que dados são o mesmo que
narrativa, ou seja, que apenas os dados na sua natureza bruta já falariam por si só. É preciso dar
ordem aos dados, organizá-los e, a partir daí, criar uma narrativa jornalística para que eles se
transformem em informações dotadas de contexto, relevância, credibilidade, legitimidade etc.
Como ressalta Barbosa (2004), não podemos entender os bancos de dados a partir de uma visão
meramente tecnicista. Pelo contrário, os bancos de dados são parte preponderante na
organização das ideias que serão formatadas na narrativa jornalística. Posto de outro modo, a
compreensão do “potencial do banco de dados na era do computador vai além daquela noção
mais básica de coleção de itens para rápida recuperação e que até então norteou os
procedimentos de armazenamento e ordenamento de informações para adquirir o status de nova
forma cultural simbólica, um novo modo de estruturar a experiência humana” (BARBOSA, 2004,
p. 462).
Assim, como uma maneira de mostrar que o banco de dados é algo basilar tanto no jornalismo
de precisão quanto no jornalismo de dados, o caso do Wikileaks evidenciou ao mundo uma nova
concepção do jornalismo que começou a ser chamada de data-driven journalism –jornalismo
direcionado ou dirigido por meio de dados (BAACK, 2011).
Logo, para além de um acessório secundário que confirma informações ou mesmo quase que
como uma peça adornável que faz parte de um infográfico, os bancos de dados entram em cena
como mobilizadores do relato jornalístico em sua expressão máxima.
NOVAS COMPETÊNCIAS DO JORNALISTA
Como é possível perceber, o jornalismo (seja ele lido enquanto campo profissional ou como
esfera de discussão acadêmica) vem passando por mudanças significativas a partir do universo
digital e, no caso específico do jornalismo de dados, pelo trabalho de coleta e mineração de
dados armazenados e passíveis de cruzamento nos bancos de dados atuais. Porém, mais do que
o próprio jornalismo em si, o profissional que atua nessa área também é afetado pelas
transformações e avanços tecnológicos que envolvem o fazer noticioso. Desse modo:
Ou seja, novas competências começaram a ser exigidas do jornalista que atua no jornalismo de
dados, especialmente porque é sua responsabilidade proporcionar contexto informacional aos
dados e transformá-los em narrativas noticiosas.
Um exemplo desse tipo profissional é Frédérik Ruys, um jornalista de dados holandês que
desenvolve infográficos e, na mesma intensidade, também atua como designer de informação.
Ele é um dos fundadores do Infographics Congress, curador do livro Infographics, na Holanda, e
editor da única revista que trata do tema, a Infographics. Ruys não é apenas jornalista de dados,
mas também designer e programador.
ANÁLISE
APRESENTAÇÃO
Ter a competência da aquisição para obter dados, quer isso signifique copiar de um site, baixar
uma planilha, preencher uma solicitação de registros públicos ou algum outro meio.
Ter a habilidade genérica da análise para fazer cálculos ou outras manipulações nos dados,
assim como para procurar padrões, histórias ou pistas.
Saber realizar a apresentação a partir da publicação de dados de forma informativa e envolvente.
Por conseguinte, fazendo uso da imagem produzida por Frédérik Ruys, é possível estender essa
reflexão para seis grandes competências que passaram a ser exigidas (ou, minimamente
ressignificadas) de modo específico pelo jornalista de dados no novo contexto digital, a saber:
PESQUISA
Ao ter em mente uma possível linha narrativa a direcionar sua produção, o jornalista de dados
inicia sua busca pelos dados.
ANÁLISE
O jornalista de dados precisa realizar testes de usabilidade e consistência para poder ver se a
base de dados que ele acabou de organizar e compilar está coerente e limpa.
COMBINAÇÃO
Os dados são filtrados, enriquecidos, cruzados. E é aí que o jornalista começa a busca por
padrões de interesse público.
VISUALIZAÇÃO
O jornalista de dados também precisa checar diferentes métodos de visualização dos dados por
meio de mapas, imagens e infográficos, pois um volume grande de dados sem forma não diz
nada.
ESCRITA
Junto ao editor, o jornalista pode escrever, por exemplo, a narração para uma matéria
audiovisual, ou mesmo determinar no storyboard os movimentos e ângulos da câmera.
ANIMAÇÃO
O jornalista de dados pode, finalmente, ser responsável por produzir animações do início ao fim,
ou seja, desde a reunião dos dados e briefing até o processo de renderização do material final.
Assim, mesmo que já tenham passado tantos anos desde a publicação da obra seminal de Meyer,
é possível ver que o jornalismo de dados deve muito de seu desenvolvimento às ideias
precursoras trazidas pelo pesquisador estadunidense. Em uma entrevista na qual discute a
atualidade do seu pensamento em um cenário já tomado pela efervescência de dados em todas
as telas, plataformas e meios, Meyer diz:
Big data
Tendência à abertura de dados
A partir daí, podemos ver que novas editorias começaram a ser pensadas dentro do contexto do
jornalismo de dados. Aqui, falaremos brevemente de dois exemplos do cenário jornalístico
brasileiro recente (exemplos de produtos comunicacionais entendidos como nativos digitais,
isso é, empreendimentos que foram pensados, criados e desenvolvidos no universo on-line já
sob as lógicas de produção e recepção do ciberespaço interativo):
EDITORIA GRÁFICO
A editoria Gráfico, como parte do portal Nexo, é reservada para reportagens baseadas em dados
dispostos por gráficos, infográficos, tabelas e toda sorte de materialidades dotadas de
visualidade em formatos coloridos, preto e branco, animados, fixos, interativos etc. Com temas
que transitam da saúde em tempos de pandemia da Covid-19 ao desequilíbrio entre gênero e
nacionalidade na carreira de astronautas ao redor do mundo, essa editoria de jornalismo de
dados é exemplo de como a estruturação do trabalho jornalístico tem sido remodelada
continuamente não só pelo aspecto tecnológico, como também pela maneira que o jornalista
interpreta ou modela os dados que têm à mão.
EDITORIA
DADOS ABERTOS
A editoria Dados Abertos, do portal Gênero e Número, é um espaço único no qual o jornalismo de
dados ao mesmo tempo que mostra o produto noticioso final (as reportagens), também dá ao
leitor a oportunidade de entender os bastidores por trás da construção noticiosa baseada em
dados. Como o próprio portal explica: “Aqui disponibilizamos todas as bases consultadas ou
levantadas pela equipe da Gênero e Número durante o processo de apuração dos conteúdos
publicados. Consulte, baixe e reutilize. Os dados são abertos!”.
Tal abertura de dados promovida pela editoria em questão faz parte de uma visão na qual o
jornalista, o portal e o receptor acabam por atuar, em tese, em regime de cocriação da notícia.
Por sua vez, valendo-se das discussões empreendias por Mancini e Vasconcellos (2016), nota-se
que Moura (2018) também destaca o papel do jornalista em se adaptar a esse novo cenário
dirigido e dominado pelo império dos dados, da dataficação:
“Segundo os autores [Mancini e Vasconcellos], entre as mudanças essenciais que permitem a
sua conceitualização, está o desenvolvimento de competências e da constituição metodológica
do trabalho adotado por parte dos profissionais. Apesar de a tecnologia facilitar o processo
como um todo, a definição de JBD [jornalismo de base de dados] encontra-se na própria ação, no
trabalho com os dados e na forma como eles são abordados.” (MOURA, 2018, p. 24-25)
VERIFICANDO O APRENDIZADO
CONCLUSÃO
CONSIDERAÇÕES FINAIS
A introdução ao jornalismo de dados foi apresentada, neste conteúdo, a partir da evolução das
tecnologias e do armazenamento de dados por meio de planilhas digitais. Mais do que isso, foi
possível perceber como o cruzamento de dados no jornalismo fez com que as narrativas
noticiosas ganhassem um novo peso no contexto digital. Assim, de modo reflexivo, o uso dos
dados no trabalho jornalístico também acabou passando pelas fronteiras da própria
conceituação do que se convencionou chamar de jornalismo de dados.
Desse modo, pudemos ver que a produção de notícia a partir de bancos de dados vem passando
por uma reestruturação da organização do jornalismo que se divide em dois eixos:
PODCAST
Agora com a palavra o professor Anderson Lopes, relembrando tópicos abordados em nosso
estudo. Vamos ouvir!
AVALIAÇÃO DO TEMA:
REFERÊNCIAS
ARAÚJO, L. V. A web e o jornalismo de dados: mapeamento de conceitos-chave. Dispositiva, v. 5,
n. 1, 2016. Consultado na internet em: 10 mai. 2021.
BAACK, S. A new style of news reporting: Wikileaks and data-driven journalism. Cyborg Subjects,
2011. Consultado na internet em: 10 mai. 2021.
BARBOSA, S. Banco de dados como metáfora para o jornalismo digital de terceira geração. Anais
VI LUSOCOM, 2004.
GEHRKE, M.; e MIELNICZUK, L. Philip Meyer, the outsider who created precision journalism
[interview]. Intexto, n. 39, p. 4-13, maio/ago. 2017. Consultado na internet em: 10 mai. 2021.
GRAY, J.; BOUNEGRU, L.; e CHAMBERS, L. The data journalism handbook. Sebastopol: O’Reilly,
2012.
LIMA JUNIOR, W. T. Big data, jornalismo computacional e data journalism: estrutura, pensamento
e prática profissional na Web de dados. Estudos em Comunicação, n. 12, 207-222. Consultado na
internet em: 10 mai. 2021.
MACHADO, E. A base de dados como formato no jornalismo digital. Actas do III SOPCOM, VI
LUSOCOM e II IBÉRICO — Volume I, 2004, p. 301-307. Consultado na internet em: 10 mai. 2021.
EXPLORE+
Quer saber mais sobre as conexões práticas entre o jornalismo digital e o mercado
jornalístico? A dica é visitar o portal Data Journalism que, com seus conteúdos em inglês,
apresenta fontes, referências, livros, produções e dicas pragmáticas para realizar um bom
projeto baseado na potência do armazenamento e do cruzamento de dados jornalísticos.
O podcast Pizza de Dados (o primeiro no Brasil a tratar sobre ciência de dados) tem um
episódio especial em sua programação que trata justamente do jornalismo de dados, das
novas capacitações exigidas pelo jornalista e das novas editorias que surgem nesse
cenário. Procure e ouça o episódio 36!
CONTEUDISTA
Anderson Lopes
CURRÍCULO LATTES