Você está na página 1de 8

Olá, pessoal,

Trainees e estudantes da Cásper,

Chamo de colegas pois ainda me considero uma recém-formada (no sentido de que estou
em constante formação embora meu último ano na Cásper tenha sido o longínquo 2010,
ano de uma atribulada porém não tanto quanto esta, campanha presidencial).

Primeiramente agradeço a todos os casperianos por terem acordado cedo para ver nossa
fala e fico muito feliz de estar ao lado de outros dois jornalistas muito mais experientes do
que eu. Falo do Conrado, fundador no Nexo (a novidade mais dinâmica da imprensa
brasileira dos últimos anos) e da Renata Cafardo, repórter especial que cobre Educação
aqui no Estadão. Quanto aos trainees do Estadão que também estão nessa lista, agradeço
também pelas muitas e inteligentes perguntas que fizeram.

Envio aqui para vocês uma enorme lista de dicas que fui acumulando nos últimos 9 anos
(desde que li um post em um site para estudantes de jornalismo ingleses), 7 dos mais
recentes mergulhada firme na ideia de adquirir habilidades para ser jornalista de dados,
sem saber por onde começar, ou onde buscar. Entretanto, as coisas no jornalismo de dados
mudam a uma velocidade incrível. Posso dizer que “quando comecei isso era tudo mato”,
ou melhor, nem mato tinha, não havia concorrência, nem vagas, nem ninguém na imprensa
dava bola pra isso. Hoje nenhuma empresa se dá ao luxo de ignorar o jornalismo de dados,
ainda que sejam poucas ainda as que invistam seriamente nele. Felizmente, o jornal
Estadão foi pioneiro nisso e por 6 anos o Estadão Dados se estabeleceu sozinho, sem ser
ameaçado pela mais remota concorrência. Essa fase acabou. Hoje a concorrência existe e
é forte, ainda bem, embora a área de dados ainda seja muito pequena no jornalismo
brasileiro. G1, Folha, O Globo, TV Globo, Gazeta do Povo, Nexo, têm seus núcleos. Além
deles BBC Brasil, Intercept, El País, Piauí e outros veículos de destaque nacional e regional
já possuem gente produzindo esse tipo de reportagem. Os maiores núcleos têm em média 5
jornalistas, o que pra realidade brasileira é um recorde, mas é muito aquém do número
praticado pelos veículos americanos. Alguns, como o Upshot do New York Times passam
de 30 jornalistas facilmente.

O nicho dos jornalistas de dados está sempre de olho em novidades e buscando integrar
novos processos em nosso trabalho. Por isso, essa lista de dicas seria muito maior, mas me
vi obrigada a retirar todas as dicas e práticas que caíram no meu desuso ou que se
mostraram obsoletas ou substituíveis no curto prazo. Uma revisão disso é sempre
constante. Abandonem as dicas em que vocês acharem soluções melhores e mais
eficientes, e as enviem para mim, via redes sociais, e-mail, etc.

Infelizmente, ainda hoje, o Brasil vive um ambiente de poucas opções de formação em


jornalismo de dados. O grande nome pioneiro dessa área foi Claudio Abramo, que nos
deixou recentemente, não sem antes contribuir, até o fim de sua vida, com a melhora da
formação do jornalismo investigativo e sobretudo do jornalismo de dados. A vantagem é que
agora você não precisa mais investir 7 anos da sua vida pra chegar no mesmo nível de
habilidade que eu tenho hoje. Com poucos meses de dedicação já dá para ficar craque.
Primeiro, conceitualmente:

Há habilidades e conceitos fora do jornalismo que muito auxiliam nosso trabalho.

1) Não se intimide com a ​matemática​. Tire da sua vida a dicotomia de “exatas” e


“humanas”. Esse primeiro passo mental é imprescindível. O medo dos números foi
criado apenas e tão somente para afastar os jornalistas de seus furos.
2) Não tenha medo da ​estatística​. A estatística faz parte do nosso dia a dia. Entretanto
não somos especialistas nem estatísticos. É importante ser craque em porcentagem
e proporção, coisas que aprendemos no ensino médio e que erroneamente
deixamos de lado durante a faculdade. Cuidado com a famosa regra de 3, ela pode
esconder armadilhas que nos levam a erros. Exemplo: Se um candidato tem 12%
dos votos no grupo de eleitores mulheres, isso não significa que 12% de seus
eleitores são mulheres, mas apenas que 12% das mulheres votam nele. Isso não é
trivial. São perguntas invertidas e quando não percebemos essa inversão erramos
feio. Estar craque no básico de estatística, saber a diferença entre moda, mediana,
média e média ponderada, é sempre uma boa. Recomendação de leitura: o livro
“Como mentir com estatísticas” de Darrell Huff (1954).
3) Correlação não é causalidade.​ Isso é um mantra. Repita-o sempre que possível.
Temos que tomar cuidado com nossas interpretações que estabelecem correlações,
nem sempre há uma base para estabelecer também a causalidade. O jornalismo
brasileiro erra muito dessa forma. O oportunismo eleitoral também mora aqui. Um
candidato em seu plano de governo fez um mapa que “mostrava” que os
assassinatos aumentaram nos estados governados pelo campo ideológico
adversário, estabelecendo assim uma correlação absurda, mas conveniente para
seu discurso. Afinal, não há nada que cientificamente demonstre correlação entre
voto e violência, ainda que o aumento da violência em alguns estados do Brasil seja
um fato incontestável. Outra correlação perigosa é a interpretação a partir de uma
correlação que existe. Por exemplo: cidades com IDH baixo votam em um partido e
não em outro desde 2006. A correlação renda x voto existe e é forte, e o partido que
dialogar mais com a urgência do brasileiro por desenvolvimento acaba levando a
melhor na disputa. Entretanto, a interpretação de que um partido fabricaria crises
econômicas para se manter sempre no poder não faz o menor sentido, nem é
cientificamente sustentável. Mas essa interpretação (causalidade espúria) nasceu de
uma correlação real e estabelecida. Então mesmo quando uma correlação é
inegável, é preciso sempre tomarmos cuidado com a causalidade que extraímos a
partir dela. Exemplo para entender correlações que não tem nada a ver:
https://revistagalileu.globo.com/blogs/buzz/noticia/2014/05/site-traz-graficos-que-mos
tram-correlacoes-absurdas.html
4) O perfil do jornalista de dados é de certa forma muito parecido com o jornalista no
geral: você precisa ser ​curioso​, e muito, muito ​criterioso​. Na prática, apenas
acabamos sendo mais “nerds” do que a média da redação e sempre muito
preocupados com metodologia. E números, claro, mas precisamos ​sempre
combater essa cultura de que jornalista não sabe mexer com números, todos
devemos mexer com isso. É muito importante não desestimular um colega que não
tem traquejo com os números. Devemos sempre incentivar os outros, mesmo
quando eles são resistentes a isso. Parte do que chamamos de básico de jornalismo
de dados na verdade deveria ser visto como básico do jornalismo em geral, e
precisamos normalizar isso dentro das redações.
Também tendemos a ser mais ligados em tecnologia e geralmente em reuniões
acabamos derrubando matérias que partem de premissas estatisticamente pouco
fundamentadas. Isso faz parte do debate de pautas. Não devemos engolir qualquer
coisa que a fonte contar. Como todo os outros jornalistas temos de estar sempre
atentos às famosas “cascatas”, e conclusões fáceis vendidas de maneira pronta para
a imprensa. Geralmente confrontamos os dados dados das fontes e seguimos sua
metodologia para termos certeza de que chegamos ao mesmo resultado, se
soubermos reproduzir o método. Essa desconfiança às vezes irrita os
“especialistas”, porque tira delas o monopólio da análise. Se a imprensa é território
de debate, cabe ao jornalista fazer a confrontação crítica das fontes de informação.
5) Uma base de dados é uma ​fonte​ documental. Parece óbvio mas o desdobramento
disso não é tão óbvio. Se a base é uma fonte, como fonte deve ser tratada como tal.
Fontes têm interesses, vieses e também erram​. Logo você deve sempre se
perguntar, ao ter em mãos uma base de dados “Quem fez essa base de dados?
Com qual método? Com qual objetivo? Para atender a qual interesse? Estou tendo
acesso a íntegra dessa base?”
6) Uma das principais diferenças entre o meu trabalho e o trabalho de um colega da
redação é que o colega sempre sabe como ele vai fazer a pauta que chega até ele.
Eu não tenho essa certeza. Eu ​sempre tenho que atender a duas perguntas
distintas: a pauta em si, como todo jornalista, e uma segunda, que é como e se é
viável executá-la. A resposta da primeira pergunta depende sempre do sucesso em
que eu respondo a segunda. É frequente que eu comece uma pauta sem saber
exatamente como vou superar todos os obstáculos que ela impõe. Essa é a parte
mais difícil, com as habilidades que dispomos, como vamos usá-las para resolver
nossos problemas.
7) Spoiler: cada pauta é sempre um ​método diferente.​ Vai da sua criatividade e
desenvoltura de criar um processo de trabalho que atenda a cada pauta que você
faz. Não existe método igual ao outro. O caminho é feito enquanto se caminha. E
sempre há mais de um caminho para chegar ao mesmo resultado. E muitos mais
caminhos que chegam a resultados diferentes, cabe a você decidir qual é o caminho
mais relevante para chegar ao resultado.
8) A parte técnica não é tudo.​ Não há curso que ensine a caçar banco de dados na
internet e nos órgãos públicos, isso é ​experiência​ pura e acúmulo de habilidade de
pesquisa. Sites do governo são uma selva hostil a ser desbravada.
9) Você está em eterna formação. Esteja sempre aprendendo ou não vai conseguir
fazer o seu trabalho tão bem quanto deveria estar fazendo. Estude sempre e esteja
antenado. Não existe estrela nem glamour no jornalismo de dados. Ainda bem.
10) Talvez pela nossa rotina ser muito ligada a uma sala, um computador, um
ar-condicionado, alguns podem achar que o ​jornalista de dados é um sujeito
desconectado da realidade do mundo​. ​Não se acomode​ com essa posição. O
jornalista de dados que conhece bem sua cidade e busca conhecer bem o Brasil
sempre vai fazer melhor o seu trabalho do que alguém que nunca sai pra sentir o
calor da rua. Conheça todos os bairros da cidade e pelo menos a dinâmica dela,
mesmo das regiões que você não frequenta. Isso vai fazer um bem incalculável para
o seu trabalho. É um perigo constante que nossas matérias fiquem sempre cheias
de números que não trazem nenhum significado humano. Combata sempre essa
armadilha se perguntando se a numeralha que você está usando ajuda a contar
melhor uma história ou a dar sentido a um fenômeno complexo. Nem sempre
adicionar mais números torna sua matéria melhor. Enfiar números demais nas
matérias pode nos levar a cair em um academicismo ou fetiche de dados e isso não
é bom, pois afasta o leitor. Escrevemos para ele e não para os nossos pares, nem
para os acadêmicos das universidades, que geralmente serão os primeiros a gostar
das reportagens de dados.

Acabadas as dicas conceituais, vamos às dicas mais ​práticas​:

Para ficar antenado no ​jornalismo em geral​:


recomendo que procure e acompanhe nas redes sociais tudo que estiver marcado em
negrito.

1) a newsletter ​Farol Jornalismo​. ​http://faroljornalismo.cc/blog/​ Eles além de resumir


bem essa tsunami de novidades ficam de olho pra gente nos longos estudos do
Nieman Lab​, que é uma espécie de bússola do que é mais pioneiro lá fora.
2) Acompanhem associações de jornalistas internacionais: ​ICIJ ​(fizeram o Panamá
Papers e ganharam o Pulitzer)​, IRE, CIR, CPJ, CIJ, ICFJ.
3) Em inglês temos o ​Journalism.co.uk​, s​ ite em que vi o primeiro post que versava
sobre jornalismo de dados, em 2009, quando essa palavra nem existia no português.
Eles existem até hoje e são muito bons. Esses são os links daquela época. E ainda
são muito atuais.
https://www.journalism.co.uk/skills/how-to-get-to-grips-with-numbers-as-a-journalist/s
7/a534975/​ e
https://www.journalism.co.uk/skills/how-to-get-to-grips-with-numbers-as-a-journalist-p
art-two-/s7/a535400/
4) Há os congressos internacionais de jornalismo também o ​GIJN​ (Congresso Global),
NICAR​ (para dados). É muito caro para nós brasileiros ir nesses congressos, mas é
lá que o pioneirismo mundial se encontra. Quem não puder ir, vale a pena
acompanhar os resumos de dicas que eles sempre dão no Twitter.
5) Eu de vez em quanto estou de olho para pegar uma casquinha do que está saindo
do forno na ​Columbia University​ (@columbiajourn) a melhor faculdade de
jornalismo do mundo.
6) No Brasil, acompanhe tudo o que faz a ​Abraji​. Associação Brasileira de Jornalismo
Investigativo. Lá tem muitas dicas, debates do que realmente se discute na profissão
e muita reflexão sobre como melhorar nosso trabalho e caminhos para constante
formação e aprimoramento. O presidente dela hoje é meu atual editor, ​Daniel
Bramatti​, do ​Estadão Dados​. Destaque para os cursos. Muitos deles, em dados.
Melhor curso online introdutório está lá (é pago e cada centavo vale a pena). Há
descontos no ​Congresso da Abraji ​(ponto de encontro dos melhores e mais sérios
jornalistas do Brasil) e outras vantagens para quem é associado, com desconto para
estudantes.
7) O ​IJNet em português​ traz várias dicas e oportunidades. Além de muitas bolsas de
jornalismo, grants, e dinheiros internacionais para você fazer sua matéria ou realizar
um projeto. Quem consegue obter tem um brilho no currículo. Muita coisa em dados.
8) Transparência​ é a coluna vertebral do jornalismo de dados e um braço muito
importante de qualquer jornalismo que se pretende sério. Não é possível existir
jornalismo de dados no Brasil antes da ​Lei de Acesso à Informação​, aprovada em
2011. Conheçam a lei, suas regras de regulamentação (a abraji tem um curso pra
isso), e usem, usem e usem. Só o uso constante dos mecanismos da lei pode
protegê-la dos interesses obscuros daqueles que querem derrubá-la.
9) Acompanhem os think-tanks de transparência: ​Transparência Internacional, Open
Knowledge Foundation, Transparência Brasil, Artigo 19.
10) O ​Manual da Credibilidade​ é um ótimo site para falar de ética no que importa,
combater as chamadas fakenews (não usem mais esse nome depois de fazer o
curso deles no Knight Center) e combater a desordem de informação.
https://www.manualdacredibilidade.com.br/
11) Às vezes, muitas vezes aliás, o conhecimento que você precisa não está dentro dos
círculos jornalísticos. Arquitetos, geógrafos, estatísticos, advogados, biólogos
também têm suas profissões passando por muitas mudanças devido à tecnologia e
têm muito a nos ensinar com suas áreas de conhecimento. Eles também estão
descobrindo a ciência de dados e têm muito a contribuir conosco. Esteja atento.
12) Segurança da informação para garantir o sigilo da fonte.​ Tenham alternativas ao
Whatsapp. ​Telegram​ e ​Signal​ são boas pedidas. Se preocupe com segurança da
informação e tecnologia. Hoje em dia a garantia do sigilo de fonte passa
obrigatoriamente pelo método de comunicação e as escolhas de plataformas e que
você usa no seu celular. Há vários manuais de segurança da informação para
jornalistas. Lembre-se, não basta que você seja ético e honesto, num mundo em que
outros não o são e podem quebrar o seu sigilo, muitas vezes sem você perceber.
Você precisa dominar os meios para mostrar a sua fonte que ela pode confiar que
você é capaz de manter sua palavra, principalmente quando se trata de informação
sensível ou sigilosa. Aprenda a dominar as técnicas para passar essa confiança ou
sua boa índole só existirá no papel.

Para aprender ​jornalismo de dados​:


1) Minha primeira dica vai para a ​Escola de Dados​, pois foi meu primeiro curso
específico para jornalistas lá em 2013/14. Foi presencial e deu o fundamento básico
do que eu uso hoje. Recomendo fortemente que fiquem de olho em tudo o que
esses caras fazem. Hoje eles só dão curso sob demanda, mas têm os melhores
tutoriais. Acompanhem também tudo do ​Google News Lab​.
2) Leiam o ​Manual de Jornalismo de Dados​ (​http://datajournalismhandbook.org/pt/​)
que foi traduzido.
3) Por falar em congresso vocês já viram o ​CODA-BR​? (Congresso Brasileiro de
Jornalismo de Dados) Esse ano é pago, e sempre vale muito a pena. Imperdível.
http://coda.escoladedados.org/​. Eu vou dar um workshop de SQL no Coda, para
ensinar a lidar com grandes bases de dados, dessas que costumam travar os
computadores.
4) Destaque dos cursos online vai para ​Centro Knight for Journalism in the
Americas​, dão vários MOOCs em português, inglês e espanhol. Tudo lá é muito
bom mesmo. Vejam o curso de ​“Como cobrir eleições sem errar”​ e nunca mais se
confundam com as pesquisas eleitorais, um erro muito mais comum do que
pensamos. Foi a última contribuição em vida do Claudio Abramo. Valorizemos.
Melhor de tudo? Todos os cursos são ​grátis​. Não deixem de fazer o curso citado
acima do “como combater as fakenews” e o “introdução ao R para jornalistas” para
quem quiser se aventurar no mais avançado. Tudo lá é bom, faça seu perfil hoje.
https://journalismcourses.org/login/index.php
5) A ​Abraji​ já foi citada, e vai ser de novo porque o melhor curso introdutório está lá. E
outros mais voltados à cobertura de política (com dados) também.
6) Há diversos sites e instituições que oferecem cursos. Alguns são gratuitos, outros
nem tanto, todos valem uma olhada. ​Poynter​, ​LEARNO ​(grátis e específico para
jornalistas), ​Udemy, Coursera​. Para quem quer já se ambientar em programação:
DataCamp​ (grátis) e ​CodeAcademy​.
7) As oficinas de ​Raspagem de Dados Públicos​ em Python do Fernando Masaroni
são ótimas.
8) Aprenda um pouco de conceitos de ​Design e Visualização de Dados​. Mesmo que
você não queira se tornar um infografista, você provavelmente vai ter que dialogar
com um. Ajuda muito aprender a falar um pouco a língua deles e eles agradecem.
9) Grosso modo costumo dizer que todo jornalista pode, rapidamente, ser um jornalista
de dados iniciante. Na verdade eu queria muito que isso acontecesse com todos os
jornalistas em todas as redações. Assim, só as coisas muito complicadas, chatas e
difíceis ficariam a cargo dos jornalistas de dados. Vou separar em três níveis, básico,
intermediário e avançado.
10) Básico:​ o primordial e fundação de tudo é saber o básico no ​Excel ​e​ Google
Sheets​. Esses dois é o que vai resolver a maior parte dos nossos problemas pelo
resto da vida. Também é nesse nível que utilizamos ferramentas como ​Flourish,
Datawrapper, Google Data Studio, Raw Graphics​. Para espiar arquivos shapes de
mapas sem abrir o QGIS, usamos o ​Mapshaper​. Também é bom saber usar aqui
um pouco de ​Maps​ e ​Fusion Tables​ do Google, para quem quiser criar mapas
rapidamente e sem muita enrolação técnica. De tudo o que fazemos no Estadão
Dados, 90% está no nível básico.
11) Intermediário​: aí vem noções mais complexas de planilhas, ​SQL e bancos de
dados​, noções de mapeamento com ​QGIS ​(ele é como se fosse um photoshop, só
do urbanismo, que precisa editar mapas e arquivos georreferenciados para fazer
análises, felizmente pode ser usado para jornalismo), limpeza de dados com​ Regex,
OpenRefine​, etc. Tudo o que não conseguimos fazer no Google Sheets ou Excel,
usamos SQL (linguagem para operar bancos de dados), seja o ​SQLite​ (linha de
código) ou sua versão em programa executável ​DB Browser​. Qualquer base de
dados com mais de 200 mil entradas entram na classificação osso-duro-de-roer,
como a do ENEM por exemplo, com 6 milhões de linhas que vão travar qualquer
computador que tente abrir em excel (não tente). Já o mapeamento é muito bom
para quem quer adicionar uma pegada geográfica a suas pautas. Mapas estão
ficando cada vez mais populares no jornalismo e vale a pena investir sua dedicação
para ficar craque nas ferramentas que lidam com eles.
12) Avançado​: é quando entramos no vasto mundo da programação. São raras as
pautas que nos exigem isso, geralmente são os projetos mais inovadores e difíceis
de realizar. Muitos programadores que também são jornalistas usam ​R​ e ​Python​,
mas tem bastante gente usando ​Javascript​. Eu escolhi me dedicar ao R, e estou
quase chegando ao nível básico. Dá trabalho, mas vale a pena. Jornalistas que
dominam isso são raríssimos no Brasil.

Veículos para ficar de olho:

1) Há veículos estrangeiros novos muito inovadores os quais não há vergonha alguma


em querermos plagiar os métodos: ​Vox, The Pudding, Timeline, Pictoline, Al
Jazeera+ (redes sociais), Playground, Projeto Draft, FiveThirtyEight,
ProPublica, IDL-Reporteros, Ojo Publico, Chequeado. ​E muitos outros podem
entrar nessa lista. Estou sempre tentando entender onde foi o pulo do gato do
sucesso deles com o público.
2) Você pode não gostar ou achar que foi um exagero, mas o projeto Snowfall foi um
divisor de águas. É preciso saber que ele existe e o que significou na imprensa.
http://www.nytimes.com/projects/2012/snow-fall/#/?part=tunnel-creek
3) ​E ​brasileiros​ também que trabalham com dados: ​Volt Data Lab, Agência Pública,
Aos Fatos, InfoAmazônia​, ​Nexo​. Além deles, há os veículos grandes com seus
núcleos. Estadão Dados, Folha Inteligência, O Globo, Gazeta do Povo.
4) Acostumem-se a seguir os Data Blogs dos veículos tradicionais estrangeiros: ​The
Guardian, Washington Post, New York Times (UPSHOT) e La Nacion​ (Argentina)
são os imprescindíveis.
5) Blog para noções de SQL: ​Entrevistando Dados​ (wordpress). Fiz o curso
presencial de SQL e valeu ​muito​ a pena. Em breve eles vão abrir novas turmas.
6) O site ​Medida SP​ faz as melhores reportagens com dados em urbanismo da nossa
cidade. Fiz o curso de introdução ao QGIS deles e é ótimo, vale o investimento.

Enfim, há muitas ferramentas e a lista pode ficar infinita. Não se preocupem tanto com
ferramentas. Elas estão sempre mudando e tomando o lugar umas das outras. O importante
é procurar dominar o espírito da tarefa e qualquer ferramenta vai lhe servir. A melhor
ferramenta é aquela ajustada exatamente para o seu problema e a que você chega a um
resultado confiável. Nem sempre a solução mais robusta ou mais inédita vai te ajudar.
Assim como nem sempre a solução mais simples dará conta do que você precisa fazer.

O Volt Data Lab fez um dicionário de tudo que eles conhecem, para a gente não se perder
no meio de tantas ferramentas.
É bem amplo. ​http://prego.voltdata.info/

Cardápio de gráficos
Nem sempre um gráfico de linha ou barra dá conta da mensagem que queremos transmitir.
Para essa situação é sempre bom ter à mão um “cardápio”

https://www.data-to-viz.com/
https://datavizcatalogue.com/
https://datavizproject.com/

Bibliografia​ de livros (em inglês) recomendados por gente da Escola de Dados.:


https://docs.google.com/spreadsheets/d/1M1-BEjWB2NaVZHde3W3EBEeJ2APGhyianqwm
s1JSPm8/edit#gid=0

Sei que é um caminhão de coisas, pessoal. E que muitas delas escapam do escopo
específico de jornalismo de dados. Mas enquanto não tivermos uma formação estruturada
em dados vamos ter que seguir o caminho do autodidatismo e da ajuda de colegas e cursos
livres. É um caminho que requer muita curiosidade e persistência. Espero que as dicas
sejam úteis para vocês.

Até mais,

Você também pode gostar