Você está na página 1de 208

UNIVERSIDADE DE SO PAULO

ESCOLA DE COMUNICAES E ARTES


PROGRAMA DE PS-GRADUAO EM CINCIAS DA COMUNICAO

MAYANNA ESTEVANIM

Processos no jornalismo digital


do Big Data visualizao de dados

So Paulo
2016





MAYANNA ESTEVANIM

V.1

Processos no jornalismo digital


do Big Data visualizao de dados

Dissertao apresentada Escola de Comunicaes e Artes da


Universidade de So Paulo (ECA/USP) para obteno do ttulo de
Mestre em Cincias da Comunicao.

rea de Concentrao: Teoria e Pesquisa em Comunicao. Linha


de Pesquisa: Comunicao e Ambincias em Redes Digitais.

Orientadora: Profa. Dra. Elizabeth Nicolau Saad Corra.

So Paulo
2016



Autorizo a reproduo e divulgao total ou parcial deste trabalho, por qualquer meio
convencional ou eletrnico, para fins de estudo e pesquisa, desde que citada a fonte.

Catalogao na Publicao!
Servio de Biblioteca e Documentao!
Escola de Comunicaes e Artes da Universidade de So Paulo
Dados fornecidos pelo(a) autor(a)



Folha de aprovao

ESTEVANIM, Mayanna

PROCESSOS NO JORNALISMO DIGITAL: do Big Data Visualizao de


Dados

Dissertao apresentada Escola de Comunicaes e Artes da Universidade de


So Paulo (ECA/USP) para obteno do ttulo de Mestra em Cincias da
Comunicao.

rea de Concentrao: Teoria e Pesquisa em Comunicao


Linha de Pesquisa: Comunicao e Ambincias em Redes Digitais

Orientadora: Profa. Dra. Elizabeth Nicolau Saad Corra

Aprovado em: _____/_____/_____

Banca Examinadora

Prof. Dr. _______________________________ Instituio: _______________________________


Julgamento: ___________________________ Assinatura: _______________________________

Prof. Dr. _______________________________ Instituio: _______________________________


Julgamento: ___________________________ Assinatura: _______________________________


Prof. Dr. _______________________________ Instituio: _______________________________
Julgamento: ___________________________ Assinatura: _______________________________



Dedicatria

Para Eno, Gael, Mait, Bella e h todos que


defendem um jornalismo de qualidade.



Agradecimentos

minha famlia
Ao Eno, pelo companheirismo na caminhada; ao Gael pela pacincia e a Mait
por ter auxiliado neste processo final. Aos meus pais Cristina e Carlos, irmo Leandro
e cunhadas do corao. Aos demais familiares e amigos por compreenderem as
ausncias nos ltimos tempos.

minha orientadora
professora Elizabeth Nicolau Saad Crrea pelo incentivo, dedicao,
pacincia e confiana depositados em mim nesta jornada acadmica.

Aos professores e pesquisadores


Aos pesquisadores do grupo COM+ da ECA-USP pelas discusses e trocas
que auxiliaram nesta pesquisa. professora Daniela Ramos por permitir que durante
um ano fosse sua aluna PAE. Aos professores que generosamente aceitaram avaliar
esse trabalho: na qualificao aos professores Daniela Bertocchi e Eugnio Bucci.

Aos apoiadores
CNPq pela bolsa de estudos, Paulo Carreta e Ana Patrcia Santos pelo
companheirismo de estudos.

Agradeo a todos que participaram da construo e formao desta dissertao e


pesquisadora.













































(...) tudo parece estar mudando ao mesmo tempo, e no existe um ponto
privilegiado, acima da confuso, de onde eu possa enxergar as coisas.
(Henry Jenkins, 2009, p. 39)



Resumo

ESTEVANIM, Mayanna. Processos no jornalismo digital: do Big Data


visualizao de dados. Dissertao (mestrado). Escola de Comunicaes e Artes,
Universidade de So Paulo, So Paulo, 2016.

A sociedade est cada vez mais digitalizada, dados em diferentes extenses so


passveis de serem armazenados e correlacionados, temos um volume, variedade e
velocidade de dados humanamente imensurveis sem o auxlio de computadores.
Neste cenrio, falamos de um jornalismo de dados que visa o entendimento de temas
complexos de relevncia social e que sintoniza a profisso com as novas necessidades
de compreenso informativa contempornea. O intuito desta dissertao
problematizar a visualizao de dados no jornalismo brasileiro partindo exatamente
do que esta visualizao de dados jornalsticos e diante dos apontamentos sobre
seu conceito e prtica questionar como proporciona diferenciais relevantes. Por
relevantes entendemos pautas de interesse pblico, que envolvem maior criticidade,
maior aprofundamento e contextualizao dos contedos no Big Data. As iniciativas
que renem imagens relacionadas a dados e metadados ocorrem nas prticas de
mercado, laboratrios acadmicos, assim como em mdias independentes. Neste
sistema narrativo atuam diferentes atores humanos e no-humanos, em construes
iniciadas em codificaes maqunicas, com bases de dados que dialogam com outras
camadas at chegar a uma interface com o usurio. H a necessidade de novas
expertises por parte dos profissionais, trabalhos em equipe e conhecimento bsico,
muitas vezes, em linguagem de programao, estatstica e a operacionalizao de
ferramentas na construo de narrativas dinmicas e que cada vez mais envolvam o
leitor. Sendo importante o pensar sobre um contedo que seja disponvel para
diferentes formatos. Para o desenvolvimento da pesquisa foi adotada uma estratgia
multimetodolgica, tendo os pressupostos da centralidade da comunicao, que
perpassa todas as atividades comunicativas e informativas de forma transversal, sejam
elas analgicas ou no. Um olhar que requer resilincias diante das abordagens
terico-metodolgicas para que as mesmas consigam abarcar e sustentar as reflexes
referentes ao dinmico campo de estudos. Para se fazer as proposies e
interpretaes adotou-se como base o paradigma Jornalismo Digital em Base de
Dados, tendo as contribuies dos conceitos de formato (RAMOS, 2012 e
MACHADO, 2003), de jornalismo ps-industrial (COSTA, 2014), sistema narrativo
e antenarrativa (BERTOCCHI, 2013) como meios de amadurecimento da
compreenso do objeto proposto.

Palavras-chave: visualizao de dados, sistema narrativo, jornalismo brasileiro, Big


Data, jornalismo de dados



Abstract

ESTEVANIM, Mayanna. Processes in digital journalism: from Big Data to data


visualization. Dissertation (Masters degree). Escola de Comunicaes e Artes,
Universidade de So Paulo, So Paulo, 2016.

Society is increasingly digitalized. Different scopes of data are likely to be stored and
correlated, having volumes, variety and accumulating speeds humanly impossible to
track and analyze without the aid of computers. In this scenario we explore the realm
of data-driven journalism with its aim of helping us understand complex issues of
social relevance and which integrates journalism with the new needs of contemporary
informative understanding. The purpose of this paper is to discuss data visualization
in Brazilian journalism, starting with what data visualization is and then, upon its
concept and practical uses, determine how this view provides relevant advantages. By
relevant advantages we mean matters of public interest with more critical, greater
depth and context of content on Big Data. Initiatives that bring together images
related to data and metadata occur on market practices, academic laboratories, as well
as independent media. This narrative system is acted upon different human and non-
human agents, whose structures are being built with machinic codifications, using
databases that communicate with other layers until reaching a user interface. There is
a need for new expertise from professionals, teamwork and basic knowledge, often in
programming languages, statistics and operational tools to build dynamic narratives
and increasingly involve the reader. It is important to think about content that is
available to different formats. For this research we adopted a multi-methodological
strategy and the assumptions of the centrality of communication that permeates all
communication and informational activities across the board, whether analog or not.
A view that requires resilience in the face of theoretical and methodological
approaches, so that they are able to embrace and support the reflections for this
dynamic field of study. To make propositions and interpretations, adopted based on
the Database Digital Journalism paradigm, and the contributions of format concepts
(RAMOS, 2012 and MACHADO, 2003), post-industrial journalism (COSTA, 2014),
system narrative and antenarrative (BERTOCCHI, 2013) maturing as means of
understanding the proposed object.

Keywords: data visualization, narrative system, Brazilian journalism, Big Data, data-
driven journalism



rea de Concentrao
Esta pesquisa insere-se na rea de Concentrao denominada Teoria e Pesquisa em
Comunicao, uma das reas mantidas pelo Programa de Ps-Graduao em Cincias
da Comunicao (PPGCOM) da ECA-USP. Esta rea est voltada s reflexes
epistemolgicas, s definies tericas e s propostas metodolgicas para o estudo do
fenmeno da comunicao em geral ou aplicada a modalidades especficas
(comunicao interpessoal, grupal, massiva, tecnologicamente mediada e outras).
rea que entende a comunicao como um campo de conhecimento interdisciplinar e
transdisciplinar desde as suas origens em funo da complexidade comunicacional e
de suas repercusses das mais variadas ordens: histrica, esttica, cultural, poltica,
social e tecnolgica.

Linha de pesquisa
O estudo encontra-se na linha de pesquisa do PPGCOM ECA-USP designada
Comunicao e Ambincias em Redes Digitais. Essa linha mantm um foco nas
reflexes epistemolgicas e nos recortes terico-metodolgicos decorrentes da
insero do fenmeno da comunicao em ambincias de redes digitais sustentadas
pelas tecnologias digitais de informao e comunicao (TICs).

Grupo de pesquisa
Esta pesquisa desenvolve-se tambm no mbito do Com+, Grupo de Pesquisa em
Comunicao, Jornalismo e Mdias Digitais. O grupo agrega pesquisas nas reas de
Polticas e Estratgias e Comunicao Digital e Tecnologias da Comunicao e Redes
Interativas. Est vinculado ao Departamento de Jornalismo e Editorao da Escola de
Comunicaes e Artes da Universidade de So Paulo; sob coordenao da profa. Dra.
Elizabeth Nicolau Saad Corra. Endereo eletrnico: http://grupo-ecausp.com/.

Financiamento
Esta pesquisa contou com o apoio do Conselho Nacional de Desenvolvimento
Cientfico e Tecnolgico (CNPq), agncia do Ministrio da Cincia, Tecnologia e
Inovao (MCTI).



Recado aos leitores

As citaes em lngua estrangeira receberam livre traduo desta autora no corpo da


dissertao. Os textos originais foram alocados nas notas de rodap.

O tema deste trabalho nos forou a utilizar algumas siglas, abreviaes e jarges
tecnolgicos do mercado de Internet. Para facilitar a leitura criamos um ndice com
essas expresses.

Ao longo dos textos destacamos frases em negrito para reforar os referenciais


adotados na pesquisa.



Lista de Figuras

Figura I. 1 Visualizao de Dados, 2013. ................................................................. 41


Figura I. 2 Nytimes.com, matria Reshaping New York, 2013. ............................... 47
Figura I. 3 - Miamiherald.com, matria Inocents Lost, vencedora do OJA 2014. ...... 48
Figura I. 4 Nytimes.com, matria State Gun Laws Enacted in Year Since Newton,
2013...................................................................................................................... 49
Figura I. 5 Esquema conceitual da visualizao de dados nesta pesquisa ................ 67
Figura II. 6 Mapa de Snow, 1854. ............................................................................ 70
Figura II. 7 Globo.com, matria A distribuio dos clientes e valores do
"Swissleaks", 2015. .............................................................................................. 72
Figura II. 8 Estadaodados.com, projeto Basmetro, 2008. ...................................... 77
Figura II. 9 Encontro Hack d'guaSo Paulo, 2014 ............................................... 78
Figura II. 10 Labic.net, cartografia A longa jornada do #MarcoCivil, 2012 ............ 80
Figura III. 11 O Sistema Narrativo no Jornalismo Digital (BERTOCCHI, 2013). 107
Figura III. 12 Verso do diagrama Chart Suggestions A Thought-Starter, de
Andrew Abela .................................................................................................... 116
Figura III. 13 Matriz de Construo Inforgrfica (TEIXEIRA, 2014) ................... 119
Figura IV. 14 Familiarizao com o tema visualizao de dados........................... 129
Figura V. 15 Estadaodados.com, home do dia 14 de dezembro de 2015. .............. 147
Figura V. 16 Usabilidade da ferramenta Basmetro taxa de governismo de
candidato do PSC/PB ......................................................................................... 150
Figura V. 17 Srie de infogrficos interativos explicam financiamento estudantil
........................................................................................................................... .155
Figura V. 18 Grfico interativo traz deputados com problemas na justia. ............ 163
Figura V. 19 Ferramenta interativa aponta qual a chance de um projeto passar na
Cmara ............................................................................................................... 165
Figura V. 20 Infogrfico interativo permite comparar o desempenho das selees da
Copa ................................................................................................................... 166
Figura V. 21 A visualizao de dados no jornalismo contemporneo .................... 182
Figura 22 Hashtag #7minutos1Denuncia Twitter, 8 de maro de 2016 .............. 188



Siglas e expresses

Para facilitar a leitura, segue relao dos significados de siglas e expresses presentes
nesta dissertao.

Accountability termo da lngua inglesa que pode ser traduzido como


responsabilidade com tica;
API (Application Programming Interface) interface de programao de aplicativos;
App (Application) aplicao, aplicativo ou software;
Backend interface digital administrativa acessvel por administradores do sistema;
Big Data gigantesco armazenamento de dados tendo a velocidade, volume e
variedade como pressupostos;
Business analytics abordagem centrada em dados que combina a cincia de anlise
preditiva com capacidades avanadas de inteligncia de negcios;
Cloud-computing (computao na nuvem) refere-se utilizao da memria e das
capacidades de armazenamento e clculo de computadores e servidores
compartilhados e interligados por meio da Internet;
CMS (Content Management System) sistema de gerenciamento de contedos;
Copyleft ou criative commons tipos de licena de direitos autorais que permitem a
outras pessoas copiar, distribuir e executar a obra original;
Copyright um direito autoral a propriedade literria que concede ao autor de
trabalhos originais direitos exclusivos de explorao de uma obra artstica, literria ou
cientfica, proibindo a reproduo por qualquer meio. uma forma de direito
intelectual;
Creative Commons ontologia web para representao de licenas autorais;
CSS (Cascading Style Sheets) linguagem de estilo que define a apresentao de
documentos HTML ou XML;
Dadosfera cenrio contemporneo diante da disposio de dados presentes na web,
que modifica a forma de coleta e armazenamento de informaes. Fator que
justificaria a necessidade de curadores de notcias.
Data-driven journalism jornalismo guiado por dados, jornalismo de dados,
jornalismo em base de dados;
Data mining (minerao de dados) funcionalidade que agrega e organiza dados,
encontrando neles padres, associaes, mudanas e anomalias relevantes;
Data scrap ou data scraping (raspagem de dados) tcnica computacional na qual um
programa extrai dados de sada legvel somente para humanos, proveniente de um
servio ou aplicativo;
Dataentry interface digital para entrada de dados;
Datastream fluxo de dados;
Frontend interface digital acessvel por usurios finais;
GIS Sistemas de Informao Geogrfica;
Grounded Theory ou GT mtodo e metodologia de pesquisa;
Hipertexto termo que remete a um texto ao qual se agregam outros conjuntos de
informao na forma de blocos de textos, palavras, imagens ou sons, cujo acesso se d
atravs de referncias especficas;
HTML (HyperText Markup Language) linguagem de marcao para criao de sites
web;



ICIJ (International Consortium of Investigative Journalists) Consrcio Internacional
de Jornalistas Investigativos;
Input / Output entrada e sada de dados;
IP - Protocolo de Internet identificao de um dispositivo (computador, impressora,
em uma rede local ou pblica);
Java linguagem server-side como PHP e Python;
JavaScript linguagem de programao interpretada;
JDBD - Jornalismo Digital de Base de Dados;
Machine Learning ou Aprendizado de Mquina mtodo de anlise de dados que
automatiza o desenvolvimento de modelos analticos;
Metadados dados sobre outros dados;
MJDBD Modelo Jornalismo Digital de Base de Dados;
MOOC (Massive Open Online Course) Curso Online Aberto e Massivo;
MySQL sistema de gerenciamento de banco de dados que utiliza como interface a
linguagem SQL, Linguagem de Consulta Estruturada, do ingls Structured Query
Language;
Open data (dados abertos) correspondem ideia de que certos dados devem estar
disponveis para que todos usem e publiquem, sem restries de direitos autorias e
patentes;
Paywall um sistema de assinatura que tem sido utilizado por jornais e outros
veculos de comunicao digitais que permite ao internauta o acesso a contedos
restritos.
PC (Personal Computer) computador pessoal;
PHP (Hypertext Preprocessor) linguagem interpretada livre para criao de sites
web;
PHP Admin aplicativo web desenvolvido em PHP para administrao do MySQL
pela Internet;
Python linguagem de programao de alto nvel;
R linguagem e tambm ambiente de desenvolvimento integrado para clculos
estatsticos e grficos;
RAC Reportagem Assistida por Computador;
Scrapping no sentido deste estudo, raspagem de dados;
SEO (Search Engine Optmization) otimizao de sites para motores de busca;
SGC (Sistema de Gerenciamento de Contedos);
SKU (Stock Keeping Unit) Unidade de Manuteno de Estoque est ligado
logstica de armazenamento e designa os diferentes itens do estoque (cdigo
identificador);
Software programa de computador;
Streaming forma de transmisso instantnea de dados de udio e vdeo atravs de
redes.
Tagging tagueamento, etiquetamento;
Template modelo;
TI Tecnologia da Informao;
TICs Tecnologias da Informao e Comunicao;
Timeline (linha do tempo) ordem das publicaes feitas nas plataformas sociais
online;
Web ou WWW sistema de documentos em hipermdia interligados e executados na
Internet
WS Web Semntica gerao de conhecimento pela mquina;
Yottabyte unidade de medida que equivale a 1024 de dados.



SUMRIO

INTRODUO .................................................................................................. 17
Objeto e justificativa ...................................................................................................................................... 24
Quadro terico de referncia ..................................................................................................................... 28
Objetivos ............................................................................................................................................................. 31
Objetivo geral: ................................................................................................................................................... 31
Objetivo especfico: ......................................................................................................................................... 31
Objetivo terico: ............................................................................................................................................... 32
Objetivo prtico: ............................................................................................................................................... 32
Mapa da dissertao ...................................................................................................................................... 32
I. VISUALIZAO DE DADOS NO JORNALISMO BIG DATA ................... 35
Dado e informao .......................................................................................................................................... 35
A visualizao de dados no jornalismo contemporneo ................................................................ 41
Exemplificando ................................................................................................................................................. 46
O jornalismo na era Big Data ...................................................................................................................... 50
Jornalismo Digital de Base de Dados (JDBD) e o jornalismo de dados .................................... 56
Jornalismo de dados: entre o senso comum e a cincia ................................................................. 62
Consideraes ................................................................................................................................................... 66
II. A ENTREVISTA AOS DADOS ..................................................................... 69
A avalanche de informaes ....................................................................................................................... 69
O passo--passo ................................................................................................................................................ 73
Visualizao de dados no jornalismo digital brasileiro .................................................................. 76
Caractersticas inerentes ............................................................................................................................. 81
Equipes ................................................................................................................................................................. 81
Tempo de produo ........................................................................................................................................ 82
Fontes dos dados .............................................................................................................................................. 82
Experincia narrativa e usabilidade ....................................................................................................... 87
Cenrio poltico e discusses sobre a Internet ................................................................................... 89
Liberdade e privacidade na rede .............................................................................................................. 91
Consideraes ................................................................................................................................................... 96
III. O FAZER JORNALISMO DE DADOS E A VISUALIZAO NO
SISTEMA NARRATIVO ................................................................................... 98
Diferentes olhares e novas prticas ........................................................................................................ 98
Princpios da narrativa contempornea ............................................................................................ 102
Jornalismo como sistema: seleo de informaes e formato narrativo .............................. 105
Escolhas e caminhos da modelagem jornalstica ........................................................................... 111
Design ................................................................................................................................................................ 114
Valor na contemporaneidade ................................................................................................................... 122
Consideraes ................................................................................................................................................. 123
IV. CONSTRUINDO A PARTIR DA DESCONTRUO CONSIDERAES
METODOLGICAS ........................................................................................ 126
Diferentes olhares ......................................................................................................................................... 126
Grounded Theory ou Teoria Fundamentada ..................................................................................... 136
Caractersticas ............................................................................................................................................... 136
Codificao e anlise ................................................................................................................................... 137
Avaliando uma Grounded Theory ......................................................................................................... 138
Aplicando a Grounded Theory no blog Estado Dados ................................................................ 140
Acompanhamento do blog ........................................................................................................................ 140
Entrevistas semi-estruturadas ................................................................................................................ 140



Caminhos de estruturao ........................................................................................................................ 141
Consideraes ................................................................................................................................................. 143
V. BLOG ESTADO DADOS .......................................................................... 145
Lindando com os dados .............................................................................................................................. 145
Blog Estado Dados ...................................................................................................................................... 147
Basmetro ........................................................................................................................................................ 149
Os desdobramentos do fazer .................................................................................................................... 151
Farra do Fies .................................................................................................................................................... 153
Os desdobramentos do fazer .................................................................................................................... 158
Reflexes desencadeadas .......................................................................................................................... 160
Pontos jornalsticos destacados ............................................................................................................. 161
Finalidade do contedo .............................................................................................................................. 161
Testes, adaptaes e autodidatismo ..................................................................................................... 163
Faro jornalstico e formao das equipes .......................................................................................... 166
Desafios do novo ............................................................................................................................................ 169
Previso ............................................................................................................................................................. 170
Repercusso do contedo .......................................................................................................................... 173
Armazenamento e recuperao de dados (datalizao) ............................................................ 174
Soluo e validao das peas ................................................................................................................ 177
A lgica da produo dos contedos .................................................................................................... 179
Sustentao terica vinculada a core category ................................................................................ 181
Consideraes ................................................................................................................................................. 184
VI. CONSIDERAES FINAIS ...................................................................... 187
REFERNCIAS ............................................................................................... 196



Introduo

INTRODUO

Esta dissertao um estudo sobre a visualizao de dados no jornalismo em um


cenrio de grande volume e velocidade de trfego de dados na Internet. Apesar de
apontar resultados finais como grficos ou infogrficos, a proposta no abordar tais
imagens no jornalismo, mas sim discutir sobre os processos e esclarecer conceitos da
visualizao de dados no jornalismo. Vivenciamos um momento onde h a fuso de
informaes e relaes nos diferentes ambientes proporcionados pela web, onde
muitos deles se complementam, ganhando dinamismo e interao com a Internet. Ao
tratar da visualizao de dados neste pesquisa podemos dizer que um determinado
tipo de visualizao em um determinado modo de fazer jornalismo, em um cenrio
que se convencionou chamar de Big Data1, fenmeno que envolve o armazenamento,
velocidade, volume e variedade de dados disponveis hoje na web.

A visualizao de dados est cada vez mais presente nos meios de comunicao e
iniciativas jornalsticas que buscam contedos relevantes para a sociedade e
inovadores na forma de apresentao da informao para os leitores. Ao visitar na
web as pginas de jornais nacionais e internacionais, possvel perceber o
crescimento das informaes visuais com sees exclusivas de dados, assim como as
j presentes sobre infografias2. As iniciativas que renem imagens relacionadas a um
grande volume de dados ocorrem nas prticas de mercado, laboratrios acadmicos3,
assim como em mdias independentes4, como observaremos ao longo da pesquisa. As
diferentes empresas de mdia tem se aperfeioado e disponibilizado na rede contedos
aprofundados sobre situaes contemporneas. O jornalismo de dados preenche as
lacunas de contedos mais densos e contextualizados aos anseios de uma sociedade


1
O termo Big Data tem origem na tecnologia da informao (TI). focado no gigantesco armazenamento de dados tendo a
velocidade, volume e variedade como pressupostos. Algumas empresas de TI, como a Oracle, ainda consideram o valor como
predeterminante. J a empresa de consultoria SAS considera outros dois pontos, a variabilidade e complexidade como
pressupostos da Big Data. Retomaremos este assunto ao longo da dissertao.
2
Entre os diversos exemplos, nacionalmente podemos destacar os blogs dos jornais Estado de S. Paulo
(http://blog.estadaodados.com) e Folha de S. Paulo (http://folhaspdados.blogfolha.uol.com.br) e internacionalmente os jornais
The Guardian (http://www.theguardian.com/data) e The New York Times (http://www.nytimes.com).
3
Entre as diversas iniciativas, o laboratrio de estudos sobre Internet e Cultura do Departamento de Comunicao da
Universidade Federal do Esprito Santo (LABIC/UFES), disponvel em: http://www.labic.net. Um segundo seria o laboratrio
em mdias e mtodos digitais da Universidade Federal do Rio de Janeiro MdiaLab, disponvel em:
http://medialabufrj.net/tag/visualizacao-de-dados/
4
Um exemplo o Hacks Hackers SP, que visa unir pessoas em aes colaborativas que envolve explorar tecnologias para filtrar
e visualizar informaes. Disponvel em: http://www.meetup.com/Hacks-Hackers-Sao-Paulo/. Outro o projeto InfoAmazonia,
que agrega dados e notcias sobre a Amaznia. Ele sustentado por uma rede de organizaes e jornalistas que oferecem
atualizaes constantes dos nove pases da regio. Disponvel em: http://infoamazonia.org.

17

Introduo

interconectada, que cada vez mais se representa a partir de imagens e nmeros.

O intuito desta dissertao problematizar a visualizao de dados no jornalismo


brasileiro partindo exatamente do que a visualizao de dados, mais especificamente
no jornalismo de dados5, e diante dos apontamentos sobre seu conceito e prtica
questionar como esta visualizao proporciona diferenciais relevantes no jornalismo.
Por relevantes entendemos pautas de interesse pblico, que envolvem maior
criticidade, maior aprofundamento e contextualizao dos contedos no Big Data.
Prope-se o estudo da visualizao de dados no momento de um jornalismo ps-
industrial6, onde ocorrem significativas mudanas no modo de jornalisticar7. H a
proximidade dos jornalistas com a audincia, em relaes no mais hierrquicas. H a
possibilidade de se aprofundar os fatos diante do anseio de uma sociedade
participativa e cada vez mais questionadora. H a necessidade de novas expertises por
parte dos profissionais de mdia como o conhecimento bsico, muitas vezes, em
linguagem de programao, estatstica e operacionalizao de ferramentas na
construo de narrativas dinmicas e que cada vez mais envolvam o leitor. Sendo
importante o pensar sobre um contedo que seja disponvel para diferentes formatos.
Mesmo no sendo especificamente o objetivo deste estudo, o que automaticamente
nos leva a rever a presena da universidade na formao dos aprofundamentos diante
de grande volume de dados e correlaes entre dados que possibilitam novas
interpretaes de fenmenos.

A disponibilidade de recursos tecnolgicos promove uma revoluo na capacidade do


indivduo em produzir e circular informao e em reunir estes dados de forma que
gerem novos sentidos. Neste cenrio, entender como alguns processos se estabelecem
so fundamentais para os estudos da Comunicao, referendando esta rea como uma
das mais importantes para a compreenso da sociedade, suas crenas e manifestaes.
Importante para situar e questionar o jornalismo enquanto prtica social (mediao,
credibilidade, agendamento, legitimidade e fluxo noticioso) que se reconfigura na

5
As variaes do termo jornalismo de dados, data-driven journalism, jornalismo de base de dados e jornalismo guiado por dados
sero amplamente utilizadas, tendo o mesmo significado conceitual, que ser melhor explicado ao longo da dissertao.
6
(...) jornalismo j no mais organizado consoante uma lgica industrial em cascata produtiva; mas com marcas mais complexas:
mais atores atuantes, mais circularidade, mais algoritmos, mais inteligncia artificial, mais computao em seu interior.
(BERTOCCHI, 2013, p. 10)
7
A professora do departamento de jornalismo e editorao da Escola de Comunicao e Artes da Universidade de So Paulo,
Dra. Elizabeth Saad, aborda o termo na mesa 2 #narrativas do evento Quem Mexeu No Meu Jornalismo? realizado pela
Faculdade Csper Lbero. Disponvel em: http://casperlibero.edu.br/assista-ao-vivo-quem-mexeu-no-meu-jornalismo/. Acesso
em: 08 de maio de 2014.

18

Introduo

nova ecologia miditica. Um jornalismo inserido em uma sociedade lquida
(BAUMAN, 2011) 8 , que sinaliza o trmino de um dado modelo de jornalismo
informativo dirio, que passa por um perodo de instabilidades, num contnuo de
mudanas que aparentemente desencadeiam processos de alargamento das fronteiras
do campo comunicacional.

Os dados na web tornam-se elementos quantitativos e manipulveis quando


transcodificados para a linguagem computacional. Uma vez transformados em
linguagem numrica possibilitam diferentes formas de visualizao a partir de
ferramentas da computao que agilizam o trabalho de fazer correlaes sejam de
dados estruturados ou no9. A prtica da visualizao de dados cada vez mais
presente tambm em diversos setores, sejam eles pblicos ou privados. A coleta e a
anlise correta dos dados tem gerado impactos expressivos em reas como finanas,
sade e educao10. Onde epidemias podem ser previstas com maior preciso; dados
gerados na educao podem ser utilizados para prever as demandas e as problemticas
do setor, e, como ocorreu as vsperas das eleies presidenciais norte-americanas, em
2012, prever o resultado dos colgios eleitorais com grande preciso11.

Hoje falamos em yottabytes12 de dados trafegados nos Protocolos de Internet (IPs). Os


dados esto disponveis em diferentes extenses, dentro e fora da web, oriundos de
diversas reas, sejam coletas estatsticas, pesquisas cientficas, clculos matemticos,
transaes financeiras. Em uma sociedade que se estrutura de forma complexa, os
desafios adquirem distintas abordagens para que as reflexes progridam com a mesma
velocidade com que o mundo se modifica, principalmente num cenrio que se
reconfigura diante da comunicao generalizada (VATTIMO, 1992). Tem-se a
dificuldade de discutir o presente, a dinmica social contempornea com


8
BAUMAN, Zygmunt. 44 cartas do mundo lquido moderno. Traduo: Vera Pereira. Rio de Janeiro: Jorge Zahar, 2011.
9
Nem todas as informaes geradas e armazenadas por computador se encontram em bancos de dados, em linhas e tabelas
estruturadas. A maior parte no est estruturada, so informaes guardadas em documentos, e-mails, vdeos, contedos em
redes sociais digitais, estruturados nas mais diferentes formas e com suas complexidades. TAKAI, O.K. Takai; ITALIANO, I.C;
FERREIRA, J.E. Introduo a Banco de Dados. DCC-IME-USP, 2005. Disponvel em: http://www.ime.usp.br/~jef/apostila.pdf.
Acesso em 5 de agosto de 2013.
10
De acordo com o relatrio Big data, big impact: new possibilities for international development 10 , produzido pelo Frum
Social Mundial realizado em 2012, em Davos, na Sua. Disponvel em: http://www.weforum.org/reports/big-data-big-impact-
new-possibilities-international-development.
11
Outras informaes podem ser obtidas na pgina do Observatrio da Imprensa. Disponvel em:
http://www.observatoriodaimprensa.com.br/news/view/_ed720_estatistico_do_nytimes_previu_resultado_dos_colegios_eleitorai
s. Acesso em: 13 de julho de 2013.
12
De acordo com o BigData-Startups, 1 yottabyte (1024) equivale a 250 trilhes de DVDs de dados, mas j se falam nos
BrontoBytes de dados (1027) no universo digital.

19

Introduo

protagonistas vivos, atuantes e sem parmetros para as situaes que se apresentam
cotidianamente. Conceitualmente partimos de alguns pressupostos, entre eles:
1o) de que a visualizao de dados se distingue de outras prticas visuais por envolver
a gerao de imagens de forma automatizada, sendo necessria para a sua realizao
desenhos algortmicos 13 que resultam em riqueza no detalhamento de dados,
principalmente porque eles podem ser trabalhados em grande escala. Inicialmente, a
principal preocupao na sua concepo no est na esttica da apresentao das
informaes, mas sim na melhor forma de evidenciar fatores que muitas vezes esto
ocultos nas diferentes extenses e correlaes dos dados (ESPERANA, 2014). Por
isso, muitas vezes, a sua leitura feita por especialistas e destinada a um pequeno
pblico.

2o) no jornalismo, as inmeras possibilidades de elementos combinatrios, grficos


estatsticos, interativos, aliados ou no a uma narrativa fazem parte do jornalismo de
dados (data-driven journalism, jornalismo guiado por dados ou jornalismo em base de
dados), inserido no paradigma Jornalismo Digital de Base de Dados (JDBD)14. O
data-driven journalism representa uma forma diferenciada de jornalismo, onde o seu
objetivo encontrar as prolas da notcia (CRUCIANELLI, 2014), contando para isso
com ferramentas digitais para manusear os dados. Rene as tcnicas do jornalismo
investigativo, de profundidade, de preciso, analtico e da reportagem assistida por
computador15. Para a pesquisadora Suzana Barbosa (2007), o jornalismo de dados traz
as caractersticas da quarta fase do jornalismo digital16, uma transcodificao do
jornalismo em um novo formato, o das bases de dados, com funes de indexar
objetos multimdia (sons, imagens, grficos), armazenar material produzido e de

13
Um algoritmo uma sequncia finita de instrues bem definidas e no ambguas, cada uma das quais pode ser executada
mecanicamente em um perodo de tempo finito e com uma quantidade de esforo finita. Fonte:
http://pt.wikipedia.org/wiki/Algoritmo. Acesso em: 10 de fevereiro de 2015. 13 Na comunicao digital, o algoritmo tem a misso
de expurgar informaes indesejveis, oferecendo apenas o que o usurio julgaria eventualmente o mais relevante para si,
conforme um modelo de negcio definido ou de acesso s informaes tambm previamente determinado pelo proprietrio do
algoritmo. J a web semntica um espao digital onde mquinas conseguem entender o significado dos dados em diversos
contextos e sem interpretaes sobrepostas. CORRA, Elizabeth S. BERTOCCHI, Daniela. A cena cibercultural do jornalismo
contemporneo: web semntica, algoritmos, aplicativos e curadoria, 2012. Disponvel em:
http://www.matrizes.usp.br/index.php/matrizes/article/view/340 Acesso em: 5 de junho de 2013.
14
Para Suzana Barbosa (2007) o data-driven jornalism uma consequncia do desenvolvimento alcanado pelo jornalismo
digital, pela tecnologia de bases de dados, pela expanso da Internet e de iniciativas de informaes livres ("open data"), e pelo
barateamento dos processos produtivos online.
15
Estas prticas jornalsticas e suas caractersticas, mesmo que sutis, sero melhor discutidas no primeiro captulo. De antemo
temos o jornalismo investigativo como uma abordagem que se trata de um tema de relevncia social que algum quer manter em
segredo. O jornalismo de profundidade semelhante ao jornalismo investigativo, com a diferena que ele no mantido em
segredo. O jornalismo de preciso envolve o uso de mtodos da investigao social aplicados ao jornalismo em investigaes
qualitativas e quantitativas. Como o prprio nome diz, o jornalismo analtico faz anlises com o intuito de oferecer provas
baseadas em interpretaes de dados. J o jornalismo assistido por computador o processo que utiliza a assistncia de
computadores durante a relao e processamento de dados.
16
A quinta fase tem as mdias mveis como agentes de um novo ciclo de inovao, a existncia de um nvel expressivo de
replicao de contedos na distribuio multiplataforma/cross-media (BARBOSA, 2013).

20

Introduo

arquivo (memria), agilizar produes, compor contedos para a web, recuperar,
informaes e, principalmente, cruzar dados que gerem uma nova informao visual e
dinmica.

Partimos da ideia de que mesmo com a presena de ferramentas gratuitas, tutoriais de


uso, difcil produzir um fluxo constante de jornalismo de dados de qualidade de
forma barata e com uma equipe reduzida (concordando com CAIRO, 2014).
Demandam-se diferentes competncias. As tcnicas utilizadas no so novas, so
mtodos quantitativos, anlises, o que torna esta prtica mais uma evoluo, do que
uma revoluo ao se trabalhar com dados. Os leitores so participativos, muitas vezes
podem conhecer profundamente o assunto, seja porque as bases de dados so pblicas
ou por serem especialistas na temtica. Os profissionais que atuam nas equipes de
dados tem que ter uma compreenso bsica de diferentes disciplinas, entender a
origem dos dados, saber como eles estavam reunidos, como sero filtrados e
processados. Principalmente, precisam contextualizar os fenmenos e fazer as
perguntas certas aos dados (CRUCIANELLI, 2014). As bases de dados no contam
histrias, no tm comeo e nem fim, e esto potencialmente sendo continuamente
alimentadas, portanto, em constante mutao. (RAMOS, 2011, p. 23).

3o) Em concordncia com a pesquisadora Daniela Bertocchi (2013), acreditamos que


narrativa digital jornalstica sistema, processo, fluxo e que dentro do sistema
narrativo a visualizao de dados revela-se como o aproveitamento do agenciamento
entre as camadas de dados e metadados (...) o qual privilegia a apresentao visual
relevante e de impacto. (BERTOCCHI, 2013, p. 180).

Ao colocar a narrativa como sistema, decidimos aqui caminhar rumo s


camadas mais subterrneas de sua modelagem: descemos primeiramente
antenarrativa (a narrativa em potencial) para, em seguida, voltarmos em
direo superfcie, observando o formato no qual ela se manifesta (com
quais tipografias, cores, formas, design, gneros textuais), expandindo
nosso olhar at a camada do usurio (lugar em que ocorrem enunciaes e
manipulaes externas narrativa e que a modificam, ou seja, o entorno do
sistema narrativo). (BERTOCCHI, 2013, p. 40).

Alm destes pressupostos, adotamos como primordial a contextualizao do momento


vivenciado pela sociedade por estarmos cada vez mais presentes na rede digital, com

21

Introduo

fluxo informativo cotidiano e com as inmeras trocas na web, nas quais deixamos
rastros passveis de serem coletados e transformados em informao. O pensador
Manuel Castells (2003) aponta que em relao aos avanos tecnolgicos, a Internet se
caracteriza mais do que como uma tecnologia e sim como um meio de comunicao,
de interao e de organizao social. Neste cenrio um desafio trabalhar com dados
no jornalismo, com narrativas inovadoras e com um pblico cada vez mais
participativo. Para o estudioso Carlos Scolari (2008), nenhuma das teorias da
Comunicao do sculo XX capaz de explicar as questes atuais do meio. A
Comunicao um objeto de mltiplas dimenses, que deve ser analisada de diversos
pontos de vista. Neste sentido, as zonas mais inovadoras de conhecimentos so as
fronteirias, os espaos de traduo. Para Scolari estamos diante de uma ruptura de
categorias que fundaram o processo cultural, do consumo e da produo
comunicacional. Os recursos tecnolgicos possibilitam um fazer jornalstico diferente,
novas formas de interao com o leitor em um tempo de produo, execuo e
consumo mltiplos. H um maior trabalho, por parte do jornalista, diante do leque de
opes em apresentar o contedo, de contextualiz-lo nos diferentes formatos.

Chegar a este estudo envolve uma trajetria de curiosidades sobre o tema e vivncias
prticas de partes do processo dentro de veculos de grande mdia (seja integrando
equipe de implantao de portal de notcia17 ou atuando na redao e alimentao de
blogs ou redes sociais 18 ). Na graduao o trabalho de concluso do curso de
Comunicao j abordava a temtica19 do jornalismo digital20. No entanto, o start
para estudar com mais profundidade o jornalismo de dados e a visualizao de dados
ocorreu aps a experincia de coordenao de um projeto de responsabilidade social
que envolvia o mapeamento de reclamaes de ouvintes sobre a infraestrutura dos
bairros em que moravam. A equipe de reportagem do projeto visitava diariamente os
bairros da capital e grande So Paulo para ouvir as demandas dos moradores. As
reclamaes eram catalogadas e encaminhadas aos rgos pblicos e existia todo um
processo de veiculao das respostas na emissora e no blog. Aps quatro anos de
atividade nas ruas, surgiu a ideia de mensurar as aes, quantific-las principalmente

17
Implantao do portal Imirante.com, do Sistema Mirante de Comunicao, So Lus/MA, 2003.
18
Entre 2008 e 2012, Rdio Globo SP, http://radioglobo.globoradio.globo.com/home/HOME.htm.
19
Jornalismo no suporte on-line: uma anlise de caso dos sites maranhenses, 2005, Universidade Federal do Maranho.
20
Evitaremos fazer distines entre jornalismo digital e no-digital, pois para ns essa dicotomia no se sustenta mais. Na
qualificao desta pesquisa, em 2015, um dos pontos argumentados pela pesquisadora Daniela Bertocchi foi da no distino
entre online e off-line j que hoje vivenciamos um tudo junto e misturado. Concordamos com este pensamento, mas no nos
aprofundaremos nele para no fugir da temtica da pesquisa.

22

Introduo

por trs fatores: primeiro para saber exatamente com o que estvamos lidando em
relao a dimenso e impacto da ao. Em segundo para justificar a presena do
projeto no cenrio de crise vivido pelo rdio AM em So Paulo, onde os resultados da
ao poderiam ser apresentados para o departamento comercial (tentativa de aquisio
de patrocnio) e para os acionistas (manuteno da iniciativa por parte da empresa).
Um terceiro fator que o banco de dados prprio serviria para classificar as principais
reclamaes de cada bairro, regio, cidade, quais obtiveram respostas de rgos
pblicos, entre inmeras outras correlaes que resultariam em uma apropriao e
projeo dos problemas vivenciados cotidianamente pelos ouvintes. A ideia de
trabalhar com os dados e construo de uma base de dados prpria no projeto entrou
em prtica a partir do esforo de duas jornalistas que no tinham conhecimento algum
em arquivamento, catalogao, ferramentas ou demandas do gnero, assim como
faltava habilidade em qualquer forma de resgate deste banco. Foi um tremendo
esforo (prprio e manual) que resultou no estmulo a retomar os estudos
especificamente nesta rea diante do atual cenrio de gerenciamento de dados, da
presena de ferramentas gratuitas, alm da enorme vontade de estar em sala de aula.

Este estudo tem como proposta uma reflexo e a audcia de tentar ir alm, rumo aos
questionamentos que contribuam para uma produtividade jornalstica com mais rigor
e cientificismo. Tendo a viso de Comunicao como um campo de conhecimento
interdisciplinar e no apenas como um aspecto da sociedade e ao propor o estudo de
um fenmeno emergente aplicado aos usos mediados da tecnologia, o presente estudo
faz parte da rea I Teoria e Pesquisa em Comunicao, do programa Cincias da
Comunicao, da Escola de Comunicao e Artes, da Universidade de So Paulo.
Integrado a linha III Comunicao e Ambincias em Redes Digitais que se ocupa
da reflexo sobre complexidades decorrentes dos impactos das Tecnologias da
Informao e Comunicao, da construo de sentido nas linguagens digitais.

Para o desenvolvimento da pesquisa foi adotada uma estratgia multimetodolgica.


Como percurso natural do incio do mestrado, recorremos as referncias bibliogrficas
que nos atualizassem sobre o cenrio do jornalismo contemporneo e o Big Data.
Com a pesquisa emprica percebemos a dificuldade de tentar olhar e compreender o
objeto partindo de teorias e metodologias j consolidadas. No entanto, permanecia o
desafio de produzir uma pesquisa com um rigor emprico e com embasamento terico
23

Introduo

condizente para entender os fenmenos jornalsticos. Por conta disso, aps a
qualificao, o olhar foi invertido para os dados e o que eles poderiam dizer. Uma
maneira de realizar as anlises dos dados qualitativos, de modo que estas fossem
enraizadas nos dados, trouxe a Grounded Theory21 (GT) ou Teoria Fundamentada
para esta pesquisa. O objetivo foi construir categorias analticas a partir dos dados de
pesquisa e, por conseguinte, respeitar o fenmeno seguindo indicaes oriundas
destes dados. Como um estudo iniciante no mestrado, na Grounded Theory e na
visualizao de dados, partimos dos pressupostos da GT e sempre do comeo: o que
so, para da entender o fenmeno. Como observao aprofundada o foco foi o
jornalismo de dados e a prtica da visualizao no blog Estado Dados, do jornal O
Estado de S. Paulo.

Objeto e justificativa

O que a visualizao de dados no jornalismo? Como ela se insere na prtica e na


narrativa do jornalismo de dados proporcionando diferenciais relevantes? O objeto
deste estudo o jornalismo de dados no Brasil, com estudo de caso do blog Estado
Dados, do jornal O Estado de S. Paulo. A escolha se deu por ter no Blog22 tanto
contedos grficos, quanto projetos em visualizao, pelas constantes atualizaes23 e
por estar em um cenrio brasileiro de investimentos nesta rea. um dos poucos em
funcionamento contnuo e no somente em projetos especiais e espordicos, o que nos
possibilitou um estudo com maior embasamento de campo diante dos nmeros de
experincias em prtica. Buscamos com o estudo de caso, um mtodo de coletar
dados do corpus, a possibilidade de aprofundar a pesquisa, de avaliar
quantitativamente e qualitativamente os processos envolvidos na produo de
contedos que envolvam o manuseio de grande volume de dados. O estudo de caso
permitiu a profundidade necessria para obter parte da compreenso desejada. A
pesquisa foi prosseguida pela Grounded Theory, que fez emergir processos
subjacentes s afirmaes dos participantes e ao fenmeno observado. O captulo IV

21
No Brasil, a GT tambm chamada de Teoria Fundamentada nos Dados, de Teoria Fundamentada em Dados, ou ainda, de
Teoria Fundada. Adotamos neste estudo a terminologia Grounded Theory (GT), em ingls, como no original da criao do
mtodo, porque o termo Teoria Fundamentada (seja em Dados ou nos Dados) traduo de uma das etapas da GT, a ltima
etapa na qual encontramos o resultado do processo.
22
Como meio de distino, toda vez que aparecer a palavra Blog, com letra inicial maiscula, estamos nos referindo ao blog
Estado Dados.
23
O acompanhamento ao Blog acontece desde 2013.

24

Introduo

destinado aos esclarecimentos metodolgicos. Fator essencial e fundamental para
justificar as escolhas adotadas ao longo do caminho. Por mais contraditrias que
possam ser em um primeiro momento, encontramos meios coesos de torn-las
sustentveis.

No jornalismo, a visualizao de dados usada para anlises de tendncias, no


cruzamento de dados e como busca de informaes no jornalismo investigativo
(RAMOS, 2011). Informaes que em decorrncia do volume, variedade e diferentes
extenses dos dados s podem ser agrupados e posteriormente correlacionados a
partir de mediao tecnolgica. Inicialmente, o terico russo Lev Manovich (2006)
apontou que o computador no delimitava o jornalismo digital, mas sim a condio
digital o delimitava. Junto com cada meio, novos signos eram gerados e muitas vezes
unindo diferentes cdigos: gestual, verbal, sonoro, visual (esttico ou em movimento).
Para ele, em um primeiro momento, a forma como os novos meios, em geral, eram
criados, distribudos, guardados e arquivados em computadores definiam a lgica e
influenciavam de maneira significativa na camada cultural e tambm nos prprios
meios de comunicao.

Podemos pensar os novos meios de comunicao, em geral, constitudos


por duas camadas distintas: a camada cultural e a camada de
informao ou informtica. Entre os exemplos de categorias que
pertencem camada cultural, temos a enciclopdia, a histria, a histria e
o enredo, a composio e ponto de vista, mime-se e catarse, a comdia e a
tragdia. Enquanto exemplos de categorias da camada de informao
temos os processos e o armazenamento de dados (como pacotes de dados
que so transmitidos atravs da rede), triagem e harmonizao, funo e
varivel, a linguagem de computador e estrutura de dados (...).
(MANOVICH, 2006, p. 93).

Ou seja, para Manovich (2006), a camada informtica afetava a camada cultural e o


mundo passava a ser modelado pela forma como os dados eram representados. No
entanto, Manovich (2013) revisou o seu conceito de base de dados afirmando que o
atual cenrio da web (que sofreu o impacto de novas foras econmicas, sociais e
tecnolgicas (web comercial, redes sociais, computao mobile) conduz cada vez
mais ao fluxo de dados, ao chamado data stream:

No meu artigo de 1998 chamei esta forma informativa de banco de dados,


em oposio organizao informativa dominante: a narrativa. Usei a

25

Introduo

palavra banco de dados ou base de dados para descrever um catlogo
de objetos que no tem uma ordem padronizada de classificao.
(Metaforicamente podemos dizer que num catlogo os objetos so
organizadas no espao em vez do tempo). (...) "Quero sugerir que, em
mdia social, tal como se desenvolveu at agora (2004-2012), banco de
dados no so mais regras. Em vez disso, a mdia social apresenta uma
nova forma: um fluxo de dados. Em vez de navegar ou pesquisar uma
coleo de objetos, o usurio experimenta o fluxo contnuo de eventos.
(MANOVICH, 2012, traduo nossa)24.

O banco, a base de dados, continua com as informaes-chave, mas coexistindo com


outras formas, entre elas a visualizao de dados. Para Ferdinand de Saussure (2006),
o ponto de vista cria o objeto, ou seja, s existe a partir do significado que damos a
ele. Boaventura de Sousa Santos (1989) traz a noo de que a cincia um
instrumento legitimador de escolha dos objetos de estudo, bem como dos problemas a
serem resolvidos na realidade, onde o papel da comunidade cientfica, alm de
presumir os focos de ao, tambm o de mediao entre o conhecimento cientfico e
a sociedade. Acompanhar, luz da cincia, como o jornalismo est construindo suas
narrativas, captando e apresentando as questes sociais latentes utilizando e
correlacionando o enorme volume de dados presentes no ciberespao, no cenrio
digital, mostra-se relevante no s para profissionais da rea, estudantes, mas para os
prprios leitores, que so o pblico alvo do jornalismo.

Em toda pesquisa, mas especialmente na rea em que o presente projeto se insere,


Teoria e Pesquisa em Comunicao, deve-se mostrar as exploraes tericas e
metodolgicas compreendendo como ela pode contribuir para trabalhos futuros e para
o avano de uma linha de pesquisa. No segundo captulo do livro Crtica
metodolgica, investigao social e enquete operria, Michel Thiollent (1980) traz as
concepes do filsofo francs, Pierre Bourdieu, entre elas a questo da neutralidade
em Cincias Sociais. Um dos primeiros critrios epistemolgicos ao qual se refere
Bourdieu consiste em considerar que toda tcnica uma teoria em atos, onde no
existe uma coleta de dados sem pressupostos tericos e preciso estar preparado, ter
um instrumental prtico e terico na hora de investigar.

24
In my 1998 article Database as a Symbolic Form I called this information form a database and opposed it to the historically
dominant way of organization information a narrative. I used the word database to describe a catalog of objects that does not
have a default sort order. (Metaphorically, we can say that in a catalog the objects are organized in space rather than in time.).
(). I want to suggest that in social media, as it developed until now (2004-2012), database no longer rules. Instead, social
media brings forward a new form: a data stream. Instead of browsing or searching a collection of objects, a user experiences the
continuous flow of events (MANOVICH, 2012). Disponvel em: <http://lab.softwarestudies.com/2012/10/data-stream-database-
timeline-new.html> Acesso em: 10 de junho de 2014.

26

Introduo

A mensurao, os instrumentos quantitativos e, de modo geral, todas as
operaes da prtica sociolgica, desde a elaborao de questionrios e a
codificao at a anlise estatstica, so teorias em atos a ttulo de
procedimentos de construo, consciente ou no, dos fatos e de relaes
entre os fatos. (BOURDIEU, 1973, p. 59)

Para Thiollent (1980), as tcnicas mais neutras, ao serem incorporadas pesquisa


sociolgica, acabam por funcionar como teorias particulares sobre a representao do
objeto investigado.

Cada tcnica contm instrumentos particulares cujo uso envolve


pressupostos tericos. Muitos epistemlogos concordam com este ponto
de vista. G. Bachelard, por exemplo, sublinhou: "Na cincia moderna,
um instrumento verdadeiramente um teorema reificado"
(BACHELARD, 1975, P. 140). Podemos considerar que os "teoremas
reificados" ou os elementos de "teoria em atos" includos na pesquisa
pelo uso das tcnicas devem permanecer sob vigilncia do pesquisador
para evitar sua autonomizao para com a teoria propriamente
sociolgica e, tambm, para superar o mito do objetivismo observacional
(THIOLLENT, 1980, p. 44).

Habita-se atualmente uma paisagem onde a digitalizao modifica a maneira como as


pessoas se relacionam com outras pessoas, com produtos e com contedos. Neste
cenrio, empresas buscam mapear o seu pblico consumidor; instituies acadmicas
visam conhecer os atores sociais e seus comportamentos a partir do digital; governos
em todo o mundo tendem a aumentar a transparncia, disponibilizando dados
referentes administrao pblica sob licenas abertas (open data); as mudanas so
inmeras e envolvem grandes volumes de dados disponveis na web. As formas de
acesso, visualizao e manipulao desses dados tm aumentado medida que novos
meios e ferramentas so descobertos. Assim como na sociedade, a visualizao de
dados no jornalismo est em processo evolutivo, introduzindo esta prtica dentro das
iniciativas das organizaes jornalsticas, com adoo de novas ferramentas, rotinas
produtivas, formatos e modos diferenciados de apresentao da informao.

O campo Comunicacional, especialmente o jornalstico, sofre o impacto de diversas


foras como: do mercado (negcios digitais e processos lucrativos); da audincia
(interao e usurios tambm produtores de contedo) e da academia (qualificao do
profissional). H outras competncias que devem ser adquiridas, entre elas saber
trabalhar em equipe. Os trabalhos unem diversos recursos como udio, vdeo, texto,
27

Introduo

em narrativas, muitas vezes, no-lineares. Conhecer o leitor torna-se ferramenta
importante diante da facilidade de disperso e de perda de audincia. O jornalismo
ps-industrial exige um trabalho maior em recursos, equipes, investimentos na
produo de um contedo com mais clareza e preciso para os diferentes pblicos. E
entender como as prticas acontecem neste cenrio de velocidade, de participaes
mltiplas do pblico, compartilhamentos e grande volume de dados e suas
representaes em imagens e ferramentas interativas mostra-se relevante para
profissionais e estudantes da rea, para leitores interessados no jornalismo
contemporneo e profissionais de reas correlatas como design, arquitetura de
informaes, computao, estatstica, entre outros.

Quadro terico de referncia

A Comunicao no possui um nico paradigma ou um campo limitado a apenas


uma disciplina. A especificidade do campo est no atravessamento dos saberes de
reas como Sociologia, Histria, Filosofia, Lingustica, Economia, Psicologia,
Antropologia, Computao, entre outros. Para Klaus Jensen (2008), a pesquisa em
Comunicao inter, trans, multidisciplinar e tradicional. Na viso de Pierre
Bourdieu (1983), o campo cientfico tem regras prprias onde outras disciplinas so
re-significadas quando adentram o campo da Comunicao. Para Edgar Morin (2006),
preciso ter em mente a noo da complexidade ao combinar diferentes perspectivas
sob um novo ponto de vista, no caso o da Comunicao. preciso que o
conhecimento faa sentido no conjunto, situar informaes e dados em seu contexto
para que adquiram sentido. A emergncia da visualizao de grandes volumes de
dados tornou- se uma necessidade crescente na sociedade e no jornalismo, e com isso,
uma forma de extrair e analisar a informao em profundidade. Por ser um tema
complexo da contemporaneidade, foram muitas idas e vindas para cercar o objeto
conceitualmente. A teoria visa trazer elementos para se entender o que a prtica,
mas os dados, neste estudo, trouxeram muitos outros elementos. Para se fazer as
proposies e interpretaes adotou-se como base o paradigma Jornalismo Digital em
Base de Dados, tendo as contribuies dos conceitos de formato (RAMOS, 2012 e
MACHADO, 2003), de jornalismo ps-industrial (COSTA, 2014), sistema narrativo

28

Introduo

e antenarrativa (BERTOCCHI, 2013) como meios de amadurecimento da
compreenso do objeto proposto.

Para Barbosa (2007), o Modelo de Jornalismo em Base de Dados (MJBD) classifica


as bases de dados como uma ruptura no procedimento de criao das notcias
jornalsticas e, portanto, um protocolo para o fazer jornalstico em rede na
contemporaneidade influenciando nos formatos visuais das notcias. O uso de bases
de dados para a produo jornalstica no recente, especialmente para o jornalismo
investigativo. Entretanto, as prprias bases de dados tornam-se cada vez mais um
meio e um produto jornalstico, ao invs de apenas um complemento a informao
(Ibidem, 2007). Cada vez mais os principais jornais esto investindo em equipes
especficas para esse tipo de trabalho e em produes de bases de dados interativas
que possuam um carter jornalstico narrativo. De acordo com o pesquisador e
professor da Escola de Jornalismo de Medill, na Universidade de Northwestern, Rich
Gordon, no artigo Data as journalism, journalism as data, de 2007, a hierarquia para
os produtos do jornalismo de base de dados se organiza em cinco nveis, definidos
conforme o grau de complexidade do uso que fazem das bases de dados. Esses nveis
seriam:

1o Entrega de dados as organizaes de notcias obtm os dados e os tornam


disponveis de uma forma navegvel, mas no h reportagem ou interao para o
usurio;

2o Pesquisa de dados usurios encontram informaes relevantes ao digitar entradas


em uma caixa de texto;

3o Explorao de dados disponibilizada uma caixa de busca na prpria pgina da


base de dados permitindo uma fcil explorao dos dados;

4o Visualizao de dados linhas e colunas geralmente no so a forma mais eficaz


de apresentar dados. Para muitos bancos de dados, a coisa mais valiosa que uma
empresa de notcias pode fazer fornecer uma maneira para as pessoas visualizarem o
que os dados mostram. As abordagens mais bvias envolvem mapeamento para bases
de dados que tem um elemento geogrfico, mas as possibilidades de visualizao de
29

Introduo

dados vo muito alm de um mapeamento;

5o Experincia em dados e narrativas unio entre reportagem tradicional e narrativa


com as capacidades do desenvolvimento de bases de dados e interao com o usurio.

Duas teses doutorais da Escola de Comunicaes e Artes da Universidade de So


Paulo contribuem para iluminar cientificamente o objeto visualizao de dados: a
primeira ao abordar o conceito de formato e a segunda ao abordar o sistema narrativo.
Em 2012, na concluso da tese Formato, condio para a escrita do jornalismo
digital de bases de dados : uma contribuio da semitica da cultura, a professora
Daniela Osvald Ramos, apresentou um estudo terico, luz da semitia da cultura,
sobre como os formatos no jornalismo digital servem de estrutura para as linguagens
digitais, entre estes formatos, a visualizao de dados. J a pesquisadora Daniela
Bertocchi, em sua tese doutoral intitulada Dos Dados aos Formatos um modelo
terico para o design do sistema narrativo no jornalismo digital, defendida no incio
de 2014, concordou com a noo de formato de Ramos e apontou que o jornalismo
guiado por dados diz respeito ao processo jornalstico que vai da captura, passando
pela curadoria e resultando na visualizao dos dados em formatos. Defendeu que
criar e manipular dados configura-se como o primeiro ato da antenarrao.
Antenarrar dados insere-se numa cultura de software e dialoga diretamente com o
jornalismo de dados (BERTOCCHI, 2013, p. 114). um tipo de formato que recorre
utilizao de vrios softwares de processamento de dados, softwares invisveis na
interface que ser acessada pelo usurio, mas onde so usadas ferramentas de
visualizao como o ManyEyes25, a Your.FlowingData26, a Visual.ly27, entre inmeras
outras. Em suma, so aes que tem por objetivo tornar humanamente mais
compreensvel e apreensvel um conjunto complexo de dados.

As transformaes vivenciadas fazem parte de um ecossistema28 social que envolve a


todos num processo de comunicao extremamente gil e facilitado pelos dispositivos


25
O ManyEyes foi desenvolvido pela IBM e usado para apresentar de forma visual o contedo. Disponvel em: http://www-
958.ibm.com/software/analytics/manyeyes/.
26
A Your.FlowingData utilizada para coletar dados atravs do Twitter, disponvel em http://your.flowingdata.com.
27
A Visual.ly usada para analisar uma extensa quantidade de dados a partir do padro do retngulos alongados (Squarified).
Disponvel em: http://visual.ly.
28
Partimos da noo de ecossistema do alemo Ernest Haeckel (1869) que introduziu o termo ecologia, de forma indita ao
abordar a relao entre ambientes e seres vivos. Aproximamos este pensamento dos estudos de mdia ao abordar a relao entre
organismos, fatores ambientais e interaes entre esses elementos (CANAVILHAS, 2010).

30

Introduo

tecnolgicos e mveis (principalmente se falarmos de acessos via celulares,
geolocalizadores, etc). Mudam-se as redaes, os processos sociais de comunicao e
as formas de interao. Neste contexto tambm ser feita uma reflexo sobre as
empresas informativas e os jornalistas que devem estar atentos as tendncias e as
transformaes na atualidade, sendo o primeiro item proposto pela pesquisadora e
professora da Escola de Comunicao e Artes da Universidade de So Paulo
Elizabeth Saad (2003) o de maior relevncia para este projeto de pesquisa:

1o) Linguagens, formatos, contedos: diferenas narrativas da notcia on-


line; configurao de um novo veculo;
2o) Estratgias, negcios e estruturas empresariais: o jornal passa a ser
parte de uma estrutura integrada de negcios; convergncia dos meios de
produo.
3o) Emergncia das mdias sociais digitalizadas: papel da blogsfera;
jornalismo cidado; redes sociais, interao por avaliao e recomendao,
comunidades. (SAAD, 2003, p.142).

Integrado a lgica da sociedade atual, a proposta terica de estudo deste projeto


tambm complexa, com caractersticas interdisciplinares e desafiadoras.
Consideramos relevante na tentativa de observar um jornalismo, reflexo de uma
sociedade, que se articula e se representa cada vez mais atravs de nmeros e
imagens.

Objetivos

Objetivo geral:

Apresentar o estado, at o presente momento, no campo da visualizao de dados no
jornalismo brasileiro. Jornalismo que engloba o cruzamento de banco de dados, as
construes de mapas, de cartografias, de infogrficos dinmicos em narrativas
diferenciadas. O que para ns fornece ao usurio o entendimento de temas complexos
de relevncia social, de forma visual, sintonizando o jornalismo com as novas
necessidades de compreenso informativa da sociedade contempornea;

Objetivo especfico:

Observar como (fontes, uso de softwares, metodologias de anlise de dados) o
jornalismo de dados brasileiro vem utilizando a visualizao de dados na produo

31

Introduo

noticiosa. Como se insere na prtica e na narrativa do jornalismo de dados
proporcionando diferenciais relevantes (pautas de interesse pblico, que envolvem
maior criticidade, aprofundamento, correlaes e contextualizao dos contedos no
Big Data).

Objetivo terico:

Contribuir para os estudos da Comunicao contextualizando as teorias com o cenrio
atual proporcionado pelos avanos tecnolgicos na coleta e no auxlio ao tratamento
de grandes volumes de dados no jornalismo.

Objetivo prtico:

Mostrar a construo do contedo noticioso a partir da visualizao em base de dados,
questionando o papel do jornalista neste cenrio onde dados podem ser somados,
comparados e integrados entre si, complementando os grandes blocos de texto que o
computador s consegue mostrar, mas no correlacionar, sem ser programado para
isso.

Mapa da dissertao

A dissertao est dividida em cinco captulos e consideraes finais. No primeiro


captulo so apresentados os conceitos sobre visualizao de dados e a distino desta
prtica diante de outras formas visuais, pontuando a relao entre o jornalismo ps-
industrial e o momento Big Data.

O segundo captulo foca no cenrio brasileiro do uso de dados. Um panorama do


cenrio jornalstico nacional, exemplificado com prticas que envolvem veculos de
grande mdia, iniciativas colaborativas e estudos desenvolvidos em laboratrios
acadmicos, finalizando com as discusses em torno de regulamentaes do trfego
de dados na web.

No terceiro captulo visamos o aprofundamento nas visualizaes de dados apontando


32

Introduo

em que momento esta prtica se encontra dentro da produo noticiosa. Para tanto,
abordamos os conceitos de narrativa como sistema, de formato e designer no
jornalismo. Abordamos as inovaes da narrativa digital jornalstica e quais os
principais impactos para as empresas de mdia. Finalizando com as questes de
credibilidade e valor jornalstico diante do cenrio cultural contemporneo.

No quarto captulo so abordados os procedimentos metodolgicos percorridos para


tentar resolver os questionamentos deste estudo. A pesquisa multimetodolgica
explicitada, assim como os critrios de observaes adotados para o olhar ao blog
Estado Dados.

O quinto captulo tem por objetivo exemplificar a prtica da visualizao de dados a


partir dos contedos trabalhados no blog Estado Dados. Parte-se de uma descrio
geral do Blog e peculiaridades de cada sesso, para da entrar nos processos includos
nas peas jornalsticas.

Por fim temos as consideraes finais que retomam as perguntas do nosso objeto: o
que a visualizao de dados no jornalismo? Como ela se insere na prtica e na
narrativa do jornalismo de dados proporcionando diferenciais relevantes? Em suma,
como o jornalismo vem utilizando a visualizao de dados na produo noticiosa
brasileira. Como acontece a captura, a curadoria dos dados, os processos de
antenarrativa, e por fim, a visualizao em um formato a ser acessado pelos usurios
nas interfaces digitais. Assim como quais as influncias presentes nesta prtica. Por
que trabalhar com a visualizao de dados no jornalismo? Seria uma possibilidade de
justificar a credibilidade? Como anda a expertise dos jornalistas para trabalhar nesta
rea?

Temos, portanto, esquematicamente pilares conceituais e estruturais.

Pilares conceituais do estudo:


a. dados dados como fonte: extrados, lidos, correlacionados, data mining, data
scrap;

33

Introduo

b. jornalismo data-driven journalism ou jornalismo guiado por dados -
reportagem tradicional + narrativas inovadoras com base de dado +
convergncias de diferentes reas = forma diferenciada de jornalismo digital.
c. visualizao de dados diferenas entre visualizao e visualizao de dados,
formas de visualizao para a equipe jornalstica e para os leitores;
d. narrativa onde fica a visualizao de dados no sistema narrativo
(antenarrativa e narrativa/formato). Instncias pr e ps (modus operandi) do
usos de dados na narrativa.
e. expertise profissional o que o profissional precisa saber para atuar.

Pilares de modus operandi:


a. Estrutural bsico: recursos (investimentos prprios ou recursos disponveis
gratuitamente); trabalho em equipe (interdisciplinar); tempo; local de
publicao; leitores usurios;
b. Ferramental: dados (base de dados, fontes pblicas, privada, fonte prpria);
tecnologias (criao e uso de ferramentas); anlise e correlaes
(aproximaes com outros recursos).

34

Captulo I

I. VISUALIZAO DE DADOS NO JORNALISMO BIG DATA

Resumo: Este captulo tem por objetivo apresentar os conceitos sobre visualizao de
dados e a distino desta prtica diante de outras formas visuais, pontuando a relao
entre o jornalismo (ps-industrial) e o momento Big Data. Tem como meta a
contextualizao desta prtica diante dos estudos contemporneos que rementem ao
paradigma Jornalismo Digital de Base de Dados chegando ao jornalismo de dados.
Temas que vo permitir aprofundar os estudos e a compreenso sobre a visualizao
de dados nos captulos subsequentes.

Palavras-chave: Jornalismo ps-industrial, Big Data, Jornalismo Digital de Base de


Dados, jornalismo de dados, visualizao de dados

Como podemos nadar en ese mar de informacin? No


tenemos que beberlo todo, tenemos que aprender a
nadar. Pierre Levy (2015).29

Dado e informao

A visualizao de dados est cada vez mais presente nos meios de comunicao e
iniciativas jornalsticas que buscam contedos com maior aprofundamento e
contextualizao. Ao visitar as pginas web de jornais nacionais e internacionais
possvel perceber o crescimento das informaes visuais com sees exclusivas de
dados, assim como as j presentes sobre infografias. As iniciativas que renem
imagens relacionadas a um grande volume de dados ocorrem nas prticas de mercado,
laboratrios acadmicos, assim como em mdias independentes. Diversas empresas
jornalsticas tem se aperfeioado e disponibilizado na rede informaes aprofundadas
sobre situaes contemporneas. O jornalismo de dados 30 aparenta preencher as
lacunas de contedos mais densos e contextualizados aos anseios de uma sociedade
interconectada, que cada vez mais se representa a partir de imagens e nmeros.


29
Fonte: Twitter @Plevy, do dia 14 de maio de 2015, disponvel em: https://twitter.com/plevy.
30
Abordaremos o conceito sobre jornalismo de dados no decorrer deste captulo.

35

Captulo I

Transcodificados para a linguagem computacional, os dados na web tornam-se


elementos quantitativos e manipulveis possibilitando diferentes formas de
visualizao a partir de ferramentas da computao que agilizam o trabalho de fazer
correlaes entre os dados.

Chegamos a difcil tarefa, neste captulo, de apresentar definies e nomenclaturas


encontradas ao longo deste estudo. Elas se fazem necessrias para contextualizar o
cenrio contemporneo de uso de dados e para dar continuidade as discusses sobre o
jornalismo e visualizao de dados em captulos posteriores. Conceitos sobre o que
so dados, informaes, design, arquitetura da informao e design da informao nos
levam a ver melhor os conflitos nestas definies e nos posicionarmos enquanto
pesquisadores. O primeiro ponto a ser trabalhado exatamente a distino entre
informao e dado, para consequentemente distinguirmos entre visualizao de dados
e visualizao da informao.

Informao enquanto conceito carrega uma diversidade de significados que vo do


uso quotidiano ao tcnico. De acordo com o Dicionrio Contemporneo da Lngua
Portuguesa, mais conhecido no Brasil por Dicionrio Caldas Aulete, informao vem
do latim informatio, onis (delinear, conceber ideia), significa dar forma ou moldar
algo31. J na Wikipdia32, informao o resultante do processamento, manipulao e
organizao de dados que representam uma modificao que pode ser quantitativa ou
qualitativa no conhecimento do sistema que o recebe. Seja este conhecimento humano
ou maqunico 33 . Para Claude Shannon (1949), pai da teoria matemtica da
informao, informao aquilo que justifica, logicamente, uma alterao ou o
reforo de uma representao ou estado de coisas. Acrescenta algo a uma
representao e estas representaes podem ser explcitas a exemplo de um mapa ou
implcitas como em uma atividade orientada para o receptor. O matemtico
estadunidense Norbert Wiener (1970), conhecido como o fundador da ciberntica34,
define informao como o termo que designa o contedo daquilo que permutamos
com o mundo exterior quando nos ajustamos a ele, e que faz com que nosso

31
Disponvel em: http://www.aulete.com.br/informa%C3%A7%C3%A3o. Acesso em 2 de maro de 2016.
32
Inclumos nesta pesquisa algumas referncias da Wikipdia, como forma de contextualizao, por acharmos relevante as
definies que so visitadas e editadas por qualquer pessoa.
33
Disponvel em: https://pt.wikipedia.org/wiki/Informa%C3%A7%C3%A3o. Acesso em 02 de marco de 2016.
34
Ciberntica o estudo dos autocontroles encontrados em sistemas estveis, sejam eles mecnicos, eltricos ou biolgicos. Foi
Wiener quem visualizou que a informao como uma quantidade era to importante quanto a energia ou a matria. Fonte:
http://pt.wikipedia.org/wiki/Informao. Acesso em: 26 de fevereiro de 2015.

36

Captulo I

ajustamento seja nele percebido (WIENER, 1970, p. 17). No Manual de Teoria da


Comunicao (2007), o professor e pesquisador portugus Joaquim Paulo Serra
distingue a palavra e o conceito antes e aps Claude Shannon. De forma sucinta, a
informao para Serra o resultado do processamento, manipulao e organizao de
dados que representa uma modificao (quantitativa ou qualitativa) no conhecimento
do sistema que a recebe.

Os dados, por sua vez, so registros e quando adquirem sentido interpretativo se


transformam em informao. Dessa forma, percebemos um fluxo crescente de
interpretao entre dado, informao e conhecimento, nessa ordem (RIBEIRO, 2009,
p. 32). De acordo com o designer Nathan Shedroff (1999), em um contexto de mdias
eletrnicas e digitais no possvel considerar como informao o vasto nmero de
estmulos, de dados disponveis hoje na web. Esses dados so apenas matria bruta,
utilizada em construes comunicativas. Os dados precisam ser organizados,
transformados e apresentados para terem significado e valor interpretativo. Neste
sentido possvel compreender o carter de apropriao e manipulao de dados
facilitados pela linguagem digital. De acordo com o dicionrio de lngua portuguesa
Michaelis, dado um conjunto de material ou informaes que esto disponveis para
anlise. tambm uma representao de fatos, conceitos e instrues, por meio de
sinais de uma maneira formalizada, possvel de ser transmitida ou processada pelo
homem ou por mquinas35. Se buscarmos a definio na Wikipdia encontramos que
dados so um conjunto de informaes (quantitativas, qualitativas, categricas ou
indefinidas) podendo ser organizadas ou no36.

Para a Escola de Dados37, dado um valor atribudo a alguma coisa. Sendo as duas
principais categorias de dados os dados qualitativos (tudo que se refere qualidade de
algo. Uma descrio de cores, textura, uma descrio de experincias, uma entrevista.
Tudo isso dado qualitativo) e os dados quantitativos (dados que se referem a
nmeros, tamanho, preo, nota em uma prova, etc). No entanto, h outras categorias
como a dos dados categricos que so os que categorizam o item descrito); os dados


35
Disponvel em: http://michaelis.uol.com.br/moderno/portugues/definicao/dados%20_938422.html. Acesso em 15 de junho de
2016.
36
Disponvel em: https://pt.wikipedia.org/wiki/Dados. Acesso em 02 de maro de 2016.
37
Programa que no Brasil nasceu dentro do captulo brasileiro da Open Knowledge e parte de uma comunidade global que
trabalha para capacitar organizaes da sociedade civil, jornalistas e cidados para usar dados abertos. Disponvel em:
http://escoladedados.org/

37

Captulo I

discretos (que so os numricos com brechas na sequncia entre eles) e os dados


contnuos (que so dados em que todos os valores so possveis, no havendo brechas
entre eles). O desafio repousa na interpretao e leitura dos dados, sejam pelas
mquinas ou pelos humanos.

Computadores so bem diferentes de humanos. Pode ser extremamente


difcil fazer computadores extrarem informaes de determinadas fontes.
Algumas tarefas fceis para humanos ainda so difceis de serem
automatizadas com computadores. A interpretao de um texto
apresentado como uma imagem por exemplo um desafio para um
computador. Se voc quiser que o seu computador processe e analise os
seus dados, ele tem que ser capaz de l-los. Isso significa que os seus
dados tm que estar estruturados, passveis de serem lidos por
computadores. Um dos formatos mais usados para a troca de dados o
CSV, sigla em ingls para valores separados por vrgula. (ESCOLA DE
DADOS, 2013)38.

Em resumo, dados pra ns so um conjunto de elementos quantitativas, qualitativas,


categricas ou indefinidas podendo ser organizadas ou no. Cada cincia vai trata-
los de acordo com caractersticas distintas e h diversas atividades que podem ser
aplicadas aos dados e as informaes, entre elas destacamos o design. A noo de
design fundamental neste trabalho, uma vez que o design que torna a operao da
escrita digital possvel. Em concordncia com Daniela Ramos (2011), criar um design
significa planejar, desenvolver uma srie de critrios e delinear um roteiro, de forma
intencional, para chegar a algum ponto, h alguma coisa39. A atividade de aplicar
design informao (ou seja, a conjuntos de dados que j passaram por crivos
interpretativos) chamada, muitas vezes, de Arquitetura da Informao ou
Engenharia do Conhecimento. A pesquisadora Giulia Giannella, em defesa de
mestrado em 2014, na Universidade de So Paulo foi alm desta definio e apontou
que a Arquitetura da Informao contempla, essencialmente, questes relativas
organizao dos dados e dos seus caminhos de acesso (navegao, usabilidade, etc.).
Acrescentou que por sua vez o Design de Informao compreende, a organizao das
informaes, as relaes entre contedo, a apresentao visual e a sua relao com o
usurio, sendo portanto mais completo e tendo em seu guarda-chuva a visualizao
da informao. Para ela, a visualizao da informao uma modalidade de
organizao e apresentao visual da informao que faz parte do universo maior do
Design da Informao (GIANNELLA, 2014). A visualizao da informao designa o


38
Disponvel em: http://escoladedados.org/manual/cursos/o-que-sao-dados/. Acesso em 15 de junho de 2016.
39
Retomaremos esta definio de design no captulo 3, onde iremos situ-lo no sistema narrativo.

38

Captulo I

processo cujo objetivo facilitar a compreenso de grande quantidade de dados e


suas relaes de semelhana, ordem e proporcionalidade. (ibidem, 2014, p. 34).

Com mais de 20 anos de experincia em computao humana e design na interao


com usurios, o consultor Peter Boersma (2004) defende o uso do termo User
Experience Design (UXD) ao abordar o conjunto de disciplinas que compem uma
rea maior formada pela Arquitetura da Informao, Design da Informao, Design de
Interao, User Interface, Engenharia de Usabilidade, Visualizao de Informao,
Estratgia de Contedo e Design Grfico, entre outras. O termo User Experience
Design foi cunhado pelo pesquisador em cincias cognitivas Don Norman, em 1995,
quando este ocupava o cargo de vice-presidente de tecnologia da Apple.

Em entrevista publicada em 2007 (Adaptative Path, 2007), Norman


afirmou ter criado o termo porque considerava interface humana e
usabilidade expresses muito limitadas. Eu queria cobrir todos os
aspectos da experincia de uma pessoa com o sistema, incluindo desenho
industrial, grficos, a interface, a interao fsica (). (BERTOCCHI et
al, 2015, p. 67).

Os estudiosos americanos que trabalham com a interao homem/computador Stuart


Card, Jock Mackinlay e Ben Shneiderman, autores do livro Readings in Information
Visualization: Using Vision to Think (1999), desenvolveram uma srie de tcnicas de
visualizao da informao. Com o mesmo desafio de situar os estudos, eles
defendem que (CARD, MACKINLAY, SHNEIDERMAN, 1999, p. 7):

Cognio externa: uso do mundo externo para alcanar cognio;


Design da Informao: Design de representaes externas para ampliar a
cognio;
Grfico de dados: uso de representaes visuais de dados abstratos para
ampliar a cognio;
Visualizao: uso de representaes visuais interativas, auxiliado por um
computador, para ampliar a cognio;
Visualizao cientfica: uso de representaes visuais interativas de dados
cientficos normalmente baseados em aspectos fsicos auxiliado por um
computador, para amplificar a cognio;
Visualizao da informao: uso de representaes visuais interativas de

39

Captulo I

dados abstratos, auxiliado por um computador, para ampliar a cognio.

J para o professor e consultor em business intellingence Stephen Few (2009), a


visualizao de dados abrange tanto a visualizao da informao como a
visualizao cientfica. Sendo a visualizao de dados uma guarda-chuva para os
estudos na rea. Como apontado, no h consensos entre as definies e nem sobre
uma nica rea de pertencimento da visualizao de dados. Ao longo da pesquisa
encontramos, inclusive, outras nomenclaturas e definies desta relao que envolve
dados, informao e visualizao:

visualizao de dados e datavis (TUFTE, 1990);


visualizao da informao e infovis (GIANNELLA, 2014);
visualizao analtica e infografia analtica (CAIRO, 2008);
infografia em base de dados ou infobases (RODRIGUES, 2009)

Neste estudo concordamos com as distines entre dado e informao e entre


visualizao de dados e visualizao da informao. Adotamos aqui a visualizao
de dados como um processo, que ser trabalhado em um jornalismo especfico, o
jornalismo de dados, que tem suas caractersticas prprias, mas que tambm se
encontra em rea fronteiria de estudo. Assim como Stefen Few (2009) um
guarda-chuva mais amplo, onde a partir da visualizao dos dados ocorrem os seus
desdobramentos40.

No grfico a seguir podemos observar que h um caminho lgico para a formao da


estrutura de visualizao de dados. Em um primeiro momento temos a explorao dos
dados, que leva a sense-making ou sensemaking (grafia que adotaremos nesta
pesquisa) que o processo pelo qual as pessoas do sentido experincia, uma
"construo de sentido", que leva a uma comunicao. Posteriormente h o uso das
visualizaes, que resultam em representaes grficas (mapas, infogrficos,
ferramentas interativas). Em Cincia da Informao, o termo sensemaking mais
frequentemente escrito como "tomada de sentido" e tem sido usado para reunir


40
Em seu estudo, a pesquisadora Giulia Giannella (2014), optou pela neologismo dispositivo infovis ao se referir a este
processo.

40

Captulo I

insights extrados da filosofia, sociologia e cincia cognitiva (psicologia


especialmente sociais). A informao no a extremidade no processo de construo
da compreenso. Quando os dados adquirem sentido interpretativo se transformam em
informao (RIBEIRO, 2009).

Figura I. 1 Visualizao de Dados, 2013.


Fonte: FEW, 2009, p. 12.

Para ns, a visualizao um meio para jornalistas e designers analisarem e


investigarem relaes entre dados, como tambm para transformar em informao
visualmente estruturada os dados. O que, como produto final miditico, objetiva
facilitar a compreenso de contedos complexos para os leitores. Defendemos que a
visualizao de dados no jornalismo est em uma rea fronteiria de estudos porque
tambm envolve outros caminhos acadmicos, inclusive os j amplamente
trabalhados na rea da Comunicao, como o jornalismo visual. No entanto, no se
restringe somente a ele, uma vez que envolve outros elementos, como defenderemos a
partir de agora.

A visualizao de dados no jornalismo contemporneo

Os conceitos referentes a visualizao de dados, como j inicialmente apontado, no


so convergentes e seu uso observado em diversas reas como Engenharia,
Estatstica, Cincias da Computao, Design da Informao, Comunicao. Os dados
disponveis hoje dentro e fora da web vem de diferentes reas, sejam coletas
estatsticas, pesquisas cientficas, clculos matemticos, transaes financeiras e a

41

Captulo I

maneira de organiz-los pode facilitar os processos de compreenso da informao.


Alm dos tipos convencionais de dados, que so os nmeros, as datas e as pequenas
cadeias de caracteres, cada vez mais comum a necessidade de suportar dados
complexos, como imagens, udios, vdeos, entre outros. Nas Cincias da
Computao, a visualizao de dados se caracteriza como a possibilidade de encontrar
diferentes formas de ver grandes volumes de dados, disponveis em diferentes
extenses, para que possam ser analisados, observados (SOUZA & BUENO, 2013).
Nem todas as informaes geradas e armazenadas por computador se encontram em
bancos de dados, em linhas e tabelas estruturadas. A maior parte no est estruturada,
so informaes guardadas em diversos documentos, e-mails, vdeos, contedos em
redes sociais digitais, com extenses distintas, estruturados nas mais diferentes formas
e com suas complexidades (TAKAI et al, 2005).

Os dados precisam ser organizados, transformados e a apresentados para ter valor e


significado. Esta caracterstica, no ambiente digital, os torna ainda mais manipulveis.
Esta manipulao est cada vez mais atrelada a evoluo da capacidade de
processamento computacional. A chamada data mining ou minerao de dados, por
exemplo, uma rea de investigao da Cincia da Computao que procura
identificar padres em um grande volume de dados digitais. Para isso recorre a
algoritmos de aprendizagem baseados em tcnicas estatsticas e de redes neurais.
Esses algoritmos visam o processamento em bancos de dados em busca de evidncias
relevantes sobre tendncias, comportamentos, relaes invisveis ou dificilmente
identificveis numa anlise humana. Para o professor Aaron Quigley, presidente da
Human Computer Interaction na Escola de Cincia da Computao da universidade
escocesa, Saint Andrews, o processo de converso dos dados, de uma origem abstrata
e sem forma geomtrica, para formas grficas conhecido como visualizao.
Quigley defende a habilidade natural humana de compreender a informao de
maneira visual. Sendo assim, em um sentido amplo, a visualizao o processo de
tornar visvel o invisvel (QUIGLEY, 2006).

No campo da Comunicao, a visualizao de dados entendida como o


aproveitamento do agenciamento entre as camadas de dados e metadados no
mbito do sistema narrativo, o qual privilegia a apresentao visual relevante e
de impacto (BERTOCCHI, 2013, p. 180). um formato que recorre utilizao
42

Captulo I

de softwares de processamento de dados que no necessariamente aparecem ao


usurio/leitor, uma vez que os resultados finais podem ser construes narrativas a
partir dos dados obtidos, como infografias, mapas, entre outros41. A visualizao de
dados resulta em informaes que so mais facilmente compreensveis. Traduz a
complexidade dos dados e suas correlaes atravs de modelos visuais. As variaes e
os padres de repetio so observveis mais facilmente quando so traduzidos em
formas geomtricas. A pesquisadora Donna Cox (2006) defende que a construo de
modelos de visualizao de dados um processo de mapeamento. Para Manovich
(2004), ao representar diferentes dados usando o mesmo cdigo numrico os
computadores facilitam o mapeamento de uma representao em outra. Para o
pesquisador Daniel Melo Ribeiro, em dissertao defendida na Pontifcia
Universidade Catlica de So Paulo (2009), o mapeamento estabelece uma relao
direta entre a visualizao de dados e a cognio, podendo criar vnculos atravs de
metforas visuais.

Tanto as metforas lingusticas quanto as visuais so definidas com


mapeamentos de um domnio de informao em outro. Cada um dos
domnios constitui um sistema de crenas, onde os indivduos veem, usam
e interpretam as imagens de acordo com suas experincias, hbitos,
preferncias e bagagem cultural. A cultura moderna, como sabemos, est
impregnada de imagens, grficos e efeitos visuais. E as metforas visuais
impactam nossa compreenso da realidade cotidiana tanto quanto as
metforas lingusticas, em termos psicolgicos e sociais. (RIBEIRO, 2009,
p. 73).

A visualizao compreende algumas caractersticas tais como o estabelecimento de


relaes topolgicas entre os dados; representaes que se atualizam a partir de
lgicas sistmicas; instrumento de descoberta, pois cada dado no um elemento
isolado, mas um n conectado a vrios pontos de diferentes redes. O que preciso
ter em mente que ao utilizar modelos de visualizao de dados so possveis
construes de sentido na medida que os dados so organizados de forma lgica,
mapeados de uma maneira apropriada, contextualizados e transformados em
informao. E no que difere, por exemplo, do jornalismo visual?

De acordo com o professor da Universidade de So Paulo Luciano Guimares (2012),



41
O jornalista americano Josh Stern publicou um post no seu blog intitulado Groundswell com as reportagens que foram
destaque no jornalismo em 2014. Elas utilizaram storytelling, recursos de udio, vdeo, satlites, sensores e imerso. Exemplos
interessantes que envolvem infogrficos e mapas em narrativas originais. O post The Best Online Storytelling and Journalism of
2014, est disponvel em http://stearns.wordpress.com/2015/01/05/the-best-online-storytelling-and-journalism-of-2014/. Acesso
em 12 de janeiro de 2015.

43

Captulo I

o jornalismo visual abrange tantos as instncias da Comunicao Visual como do


Jornalismo, onde so criadas formas de representao do contedo informativo,
resultando, na maioria das vezes, em manifestaes texto-visuais. A prtica existe
desde o aparecimento do jornal e evoluem com os recursos tecnolgicos disponveis,
os resultados so desde charges, ilustraes, fotografias at os infogrficos, entre
outras prticas. No caso da visualizao de dados, o que a diferencia de outras
prticas a sua origem e apurao que requer diferentes expertises no fazer
jornalstico que emergem a partir de congruncias e manuseio de grande volume de
dados. Nos concentramos, prioritariamente, no fator tecnolgico como um dos pr-
requisitos para estudar as peas jornalsticas que sero exploradas no captulo 5. Isso
se d pela demanda do uso de diferentes tecnologias e anlises estatsticas diante da
grande quantidade de dados, neste cenrio contemporneo do Big Data42.

Em concordncia com o Manual de Jornalismo de Dados43 (GREY et al. 2012), ao


contrrio de outros recursos visuais, como a fotografia e o vdeo, a visualizao de
dados est enraizada em fatos mensurveis. Pode ser eficaz tanto para apresentar
notcias, transmitindo rapidamente informaes pontuais como a localizao de um
acidente e o nmero de vtimas, como para reportagens, nas quais pode aprofundar
um tema e oferecer uma nova perspectiva sobre algo familiar. A visualizao de
dadose as associaes estticas que fazem parte dela, podem at se tornar uma
referncia cultural, assim como a representao de divises polticas em um processo
eleitoral. Para o professor de visualizao de dados e infografia da Escola de
Comunicao da Universidade de Miami, Alberto Cairo (2012), a informao
desestruturada sinnimo de realidade, do mundo que nos rodeia e de suas
complexidades. Os fenmenos passveis de serem observados se constituem como
informao. Os dados por sua vez so registros de observaes, se codificam como
smbolos, sejam nmeros ou palavras, e descrevem e representam a realidade. A
informao estruturada ou semntica diz respeito aos dados que podem ser
entendidos, sendo portanto, um segundo nvel de codificao, que consiste em
representar os registros de forma que se tornem compreensveis. Para ele, o consumo
de informaes contextualizadas pode levar cada vez mais ao aumento do

42
Muitos estudos envolvendo este grade volume e variedade de dados vem sendo chamado de Cincia de Dados. Para o
consultor Nuno Moura Pires (2014), a Cincia de Dados procura descobrir conhecimento, a partir de uma quantidade grande e
pesada de dados, para a tomada de decises e para fazer previses. No simplesmente a interpretao de nmeros.
Concordamos com essa viso, mas para no adentrar em outra discusso iremos nos referir nesta pesquisa apenas por Big Data.
43
Disponvel em: http://datajournalismhandbook.org/pt/index.html. Acesso em 30 de janeiro de 2015.

44

Captulo I

conhecimento, onde o leitor assimila o que lhe apresentado, comparando e


mesclando com sua prpria memria e experincia (CAIRO, 2012).

Visualizao aquela tecnologia plural (isto , disciplina) que consiste em


transformar dados em informao semntica ou em criar as ferramentas
para que qualquer pessoa complete por si s este processo por meio de
uma sintaxe de fronteiras precisas e constantes evolues baseadas na
natureza arbitrria e abstrata (no figurativas: textos, estatsticas, etc).
(CAIRO, 2012, p. 38).44

Neste sentido, torna-se interessante pontuarmos a distino, ao nosso ver, entre a


visualizao de dados e a infografia. Comumente elas caminham juntas nas
peas jornalsticas, mas fundamentalmente e operacionalmente h distines. A
infografia consiste em apresentar informaes, em reduzir, editar e eleger os dados
relevantes, eliminando dados secundrios. Nelas so utilizadas formas grficas para
que os dados sejam compreensveis pelo pblico leitor. J a visualizao de dados a
disciplina que se ocupa de criar ferramentas visuais, muitas vezes interativas, para que
uma determinada audincia, geralmente composta por pesquisadores e acadmicos,
possam estudar e explorar os dados. No jornalismo, pode ser uma etapa para se
trabalhar os dados e posteriormente apresent-los, em diferentes designs, para o leitor,
inclusive em um infogrfico.

Explicado de outra forma: em uma visualizao o usurio ocupa o lugar de


editor: elege quais dados quer ver e como quer v-los para analiz-los com
maior comodidade. Apresentao e explorao so as funes que, de
acordo com esta corrente terica, caracterizam e separam a infografia da
visualizao. (CAIRO, 2011)45.

Para ns, como j mencionado, a visualizao de dados um termo guarda-chuva que


envolve um processo que determina a forma de apresentao do produto final em um
trabalho jornalstico46.


44
Visualizacin es aquella tecnologa plural (esto es, disciplina) que consiste en transformar datos en informacin semntica
o en crear las herramientas para que cualquier persona complete por s sola dicho proceso por medio de una sintaxis de
fronteras imprecisas y en constante evolucin basada en la conjuncin de signos de naturaleza icnica (figurativos) con otros de
naturaleza arbitraria y abstracta (no figurativos: textos, estadsticas, etc.). (CAIRO, 2012, p. 38).
45
Explicado de otra forma: en una visualizacin el usuario ocupa el lugar del editor: elige qu datos quiere ver y cmo quiere
verlos, para analizarlos con mayor comodidad. Presentacin y exploracin son las funciones que, segn dicha corriente terica,
caracterizan y separan a la infografa de la visualizacin (CAIRO, Alberto, 2011, traduo nossa).
46
Como contextualizao, h distines entre a visualizao de informao e infogrficos46 . Para o pesquisador Robert Kosara
(2010), os infogrficos so, em teoria, produzidos manualmente e utilizados para conjuntos especficos de dados, enquanto
visualizaes de informao so desenvolvidas de modo mais automtico por ferramentas que possibilitam aplicar uma mesma
forma grfica a diversos conjuntos de dados. Giannella (2014) discorda de Kosara sobre a tecnologia de produo ser

45

Captulo I

Exemplificando

Partindo para exemplos prticos, toda visualizao de dados pode ser representada
como converter-se em uma ferramenta passvel de manipulao pelo leitor. No
entanto, a chave dos melhores grficos consiste em ter um equilbrio entre apresentar
47
e facilitar certos aprofundamentos (CAIRO, 2011). Os melhores grficos
conseguem extrair significados e tendncias vinculados ao cotidiano das pessoas. No
Brasil, as produes em visualizao de dados e peas inforgrficas, entre outros
formatos em base de dados, so comparativamente mais recentes e em menor escala.
Houveram iniciativas, por exemplo, como o Infolide48, evento anual realizado em So
Paulo e que evidenciava produes infogrficas nacionais. Em 2013, seis trabalhos
brasileiros49 foram premiados no Malofiej, que se destaca como uma das maiores
premiaes mundiais de inforgrafia50. O jornal O Estado de S. Paulo chegou a
conquistar medalha de ouro na categoria Portflio, com a srie sobre os Estdios da
Copa de 2014 51 . J conhecido o projeto InfoAmaznia 52 , do jornalista Gustavo
Faleiros, esteve entre os finalistas. Em 2015 o blog Estado Dados, do Jornal O
Estado de S. Paulo foi o grande vencedor da 60a edio do ExxonMobil 2015 (antigo
Prmio Esso de Jornalismo) 53 , com a matria Farra do Fies, onde foram
correlacionados dados de mais de 42 mil alunos com bases de dados do Censo de
Educao Superior e do Portal de Transparncia, do Governo Federal (este caso ser
melhor explorado no 5o captulo deste estudo).

O jornal The New York Times vem se destacando em coberturas de dados com o uso
de ferramentas prprias e em narrativas diferenciadas e interativas. A matria

determinante para a distino entre infografia e visualizao da informao. Para ela, a infografia uma prtica ampla que gera
produtos jornalsticos texto-visuais, customizados ou com base em templates, criados para fins predominantemente informativos
usando conhecimentos tericos e prticos do campo da Comunicao e do Design. J a visualizao da informao, seja ela
interativa ou no, constitui uma modalidade de representao grfica que visa elucidar um fato, um ponto de vista objetivo,
consistindo em processo de ampliao da cognio e do conhecimento. Ainda de acordo com Giannella, h infogrficos
interativos que se apropriam das tcnicas da visualizao da informao para organizar, cruzar e apresentar relaes entre dados
constituindo-se como um dispositivo miditico de caractersticas especficas que tanto demonstra mediao jornalstica do
contedo como permite ao usurio certa autonomia na construo do percurso narrativo por meio de recursos interativos. Neste
meio existiria tambm as infobases, que tem a base de dados e uso de aplicativos de softwares baseados na web (APIs46) em sua
constituio, que utilizam dados armazenados em outros diretrios.
47
la clave de los mejores grficos consiste en lograr un equilibrio entre presentar y facilitar cierta profundizacin (CAIRO,
2011, traduo nossa).
48
Disponvel em: http://www.infolide.com. A ltima edio do evento aconteceu em 2013.
49
Ver: http://visualoop.com/br/5250/os-infograficos-brasileiros-premiados-no-malofiej-21
50
http://www.malofiejgraphics.com
51
Disponvel em: http://www.estadao.com.br/infograficos/maracana-fica-mais-moderno-sem-abrir-mao-de-sua-
historia,esportes,208362
52
Disponvel em: http://infoamazonia.org/
53
http://politica.estadao.com.br/noticias/geral,pelo-segundo-ano-consecutivo--estado-vence-o-principal-premio-de-jornalismo-
no-brasil,1782259 ou http://politica.estadao.com.br/noticias/geral,jornalistas-do-estado-recebem-no-rio-premio-esso-de-
jornalismo--imp-,1795558

46

Captulo I

Reshaping New York 54 , um exemplo. Ela foi premiada na categoria melhor


visualizao de dados no Data Journalism Awards 201455, em Barcelona.

Figura I. 2 Nytimes.com, matria Reshaping New York, 2013.

Fonte: The New York Times, 2013.

A matria trouxe inmeras informaes sobre o boom de novas habitaes em Nova


York, mesmo no perodo de recesso. Os dados mostraram a mudana nos bairros nos
ltimos anos, incluindo a presena de edifcios e ciclovias. uma leitura imersiva,
interativa, repleta de fotos e que retrata as modificaes de doze anos em que o
prefeito Bloomberg esteve no comando. A partir da matria possvel ver o
crescimento macio na construo residencial, o rezoneamento de todos os cinco
distritos para facilitar o crescimento econmico, a adio de 450 milhas de ciclovias,


54
Disponvel em: http://www.nytimes.com/newsgraphics/2013/08/18/reshaping-new-york/. Acesso em 26 de fevereiro de 2015.
55
O evento um dos principais agregadores de publicaes inovadoras. organizado pela Global Editors Network, uma
comunidade multi-plataforma de editores-chefes e inovadores de mdia comprometida com o jornalismo sustentvel e de
qualidade. Disponvel em: https://www.globaleditorsnetwork.org/programmes/data-journalism-awards/

47

Captulo I

de dezenas de praas de pedestres e muitas outras informaes referentes a cidade. H


fotos de antes/depois, edifcios e bairros clicveis e recursos interativos que
permitem que voc faa diversos caminhos na busca de informaes.

J o vencedor na categoria Knight Award for Public Service, do Online Journalism


Awards (OJA) 56, em 2014, foi a publicao Inocents Lost, do jornal Miami Herald57.
O material, fruto de um intenso trabalho de investigao, rene informaes sobre o
aumento das mortes de crianas aps o Estado americano da Flrida reduzir as
protees para as crianas em lares problemticos. Entre as fontes, relatrios policiais,
autpsias, entrevistas e busca nos ltimos cinco anos dos homicdios registrados pelo
Department of Children & Families. Foi criada uma base de dados de cada morte,
com as fichas policiais, mapas e relatos que pde ser acessada pelo leitor.

Figura I. 3 - Miamiherald.com, matria Inocents Lost, vencedora do OJA 2014.

Fonte: Miami Herald, 2014.



56
A premiao que existe desde 2000 foi criada pela associao de jornalistas Online News Association (ONA)56 com o objetivo
de inspirar e estimular os jornalistas a desenvolverem habilidades e competncias que lhes permitam fazer uso das ferramentas
digitais para melhor contar as suas histrias. Disponvel em: http://journalists.org/awards/2014-awards/
57
Disponvel em: http://media.miamiherald.com/static/media/projects/2014/innocents-lost/

48

Captulo I

O Malofiej Awards, como j mencionado, uma das maiores premiaes mundiais de


inforgrafia que acontece desde 1993. O infogrfico State Gun Laws Enacted in Year
Since Newton58, tambm do The New York Times, foi o vencedor, em 2014, em duas
categorias: reportagem impressa e prmio Peter Sullivan /Best of Show. A
reportagem aborda o porte de armas aps o tiroteio na Sandy Hook Elementary
School, em Newtown, Connecticut e que aps este acontecimento em quase todos os
Estados pelo menos uma nova lei de armas entrou em vigor. Os dados foram
compilados pelo Centro de Direito para Prevenir a Violncia Armada (em ingls, Law
Center to Prevent Gun Violence). H informaes de cada Estado, com linhas do
tempo. Nas correlaes, a maioria das aprovaes foram em Estados controlados
pelos republicanos, que tendem a aprovar leis que diminuem a restrio quanto ao
porte de arma. Ocorrendo, comparativamente, o inverso nos Estados democrticos.

Figura I. 4 Nytimes.com, matria State Gun Laws Enacted in Year Since Newton, 2013.

Fonte: The New York Times, 2013.


58
http://www.nytimes.com/interactive/2013/12/10/us/state-gun-laws-enacted-in-the-year-since-newtown.html

49

Captulo I

A partir da breve descrio dos exemplos possvel perceber que ocorre a formao
de distintas base de dados e a correlao entre elas. As formas de levar estas
informaes aos leitores tambm diversa, mas todas conseguem aprofundamentos e
reflexes importantes, permitindo que o usurio/leitor se aproprie e navegue por
diferentes caminhos. Os contedos tambm tornam-se base para outras matrias e
passam a ser referncia na busca de informaes. Os projetos que se tornam
permanentes recebem atualizaes constantes. Alguns em tempo real, linkados as
prprias bases de dados de polcias e outras instituies envolvidas.

O que queremos discutir de forma aprofundada neste estudo a forma de


execuo, os processos de deciso, elementos que ocorrem em um backend
jornalstico que nos captulos seguintes sero melhor explorados. A leitura dos
contedos no nos permite entender o todo, os recursos e as dificuldades envolvidas
no fazer, mas j nos dimensionam os caminhos do jornalismo de dados.


O jornalismo na era Big Data

Sociedade, tecnologia, comunicao, economia, h pontos-chave que devem ser


trabalhados para se entender o contexto do jornalismo digital na contemporaneidade.
Aspectos que refletem em mudanas na prtica, nas necessidades de recursos, na
forma de ver o produto jornalstico. Diferentes denominaes tem sido utilizadas para
nomear este momento sociocomunicacional (SAAD, 2014) como espao pblico
social (MIGE, 2009), esfera pblica conectada (BENKLER, 2006), sociedade
informacional (CASTELLS, 2003), sociedade da comunicao generalizada
(VATTIMO, 1992), entre outras, mas seja qual for a denominao e suas variveis,
vivencia-se um ciberespao hbrido, de linha tnue entre as esferas pblica e privada.
Estamos em um perodo de novas formas de conhecimento e de acesso a informaes
possibilitado pelas inmeras experimentaes no ambiente digital. Saber o que
acontece no Brasil, no mundo e no crculo de amigos atravs das redes sociais cada
vez mais comum, por exemplo.

50

Captulo I

Vivemos uma era em que se convencionou chamar de Big Data onde h uma
quantidade enorme de informaes que os humanos produzem e no conseguem
processar sem a ajuda da computao. Situao mediada por tecnologias e que
demanda um contnuo desenvolvimento tecnolgico por parte de governos,
instituies e empresas privadas. Big Data, portanto, um termo que abrange o
crescimento, a disponibilidade e o uso exponencial de informaes e leva a
questionamentos sobre como pode servir como base para a inovao, a
diferenciao e o conhecimento sobre os mais diferentes aspectos da sociedade
seja cultura, poltica, religio, sade, habitao, entre inmeras outras finalidades.

O volume exponencial de dados advm do armazenamento de contedos ao longo dos


anos, dados de texto em streaming59 nas mdias sociais, dados criados por usurios, e-
mails, vdeos, udios, mercado de transaes financeiras. Em 2011, o relatrio "Big
Data Analytics: Future Architectures, Skills and Roadmaps for the CIO", do
International Data Corporation IDC 60 (empresa de inteligncia de mercado e
consultoria nas indstrias de tecnologia da informao, telecomunicaes e mercados
de consumo em massa de tecnologia) j apontava que 80% dos dados de uma
organizao no eram numricos, estavam disponveis em outras extenses.

H tambm uma tendncia mundial de governos em aumentar a transparncia dos


dados disponibilizando cada vez mais informaes referentes administrao pblica.
As iniciativas open data tambm tendem a ser mais frequentes, assim como a
produo de contedos jornalsticos e sees em sites especificamente para
disponibilizar dados produzidos, organizados e estruturados por profissionais atravs
de APIs. No Brasil so diversas as iniciativas como o Dados.gov.br61, a Lei de Acesso
Informao62; so inmeras as formas de armazenamento, processamento, anlises e
visualizaes de dados. At recentemente as organizaes se limitavam ao uso de
subconjuntos de amostras dos seus dados e a anlises simplistas porque os volumes
absolutos de dados sobrecarregavam as plataformas de processamento. Cada vez h


59
De acordo com o site de tecnologia da Globo.com, TechTudo, streaming uma forma de transmisso instantnea de dados de
udio e vdeo atravs de redes. Por essa tecnologia possvel assistir a filmes ou escutar msica sem a necessidade de fazer
download, o que torna mais rpido o acesso aos contedos online (COUTINHO, Mariana (2013). Saiba mais sobre streaming, a
tecnologia que se popularizou na web 2.0. Disponvel em: http://www.techtudo.com.br/artigos/noticia/2013/05/conheca-o-streaming-
tecnologia-que-se-popularizou-na-web.html. Acesso em: 25 de junho de 2016).
60
Disponvel em: http://br.idclatin.com/default.aspx
61
Disponvel em: http://dados.gov.br
62
Disponvel em: http://www.acessoainformacao.gov.br/assuntos/conheca-seu-direito/a-lei-de-acesso-a-informacao

51

Captulo I

mais necessidade de incorporar grandes volumes de dados na anlise usando


diferentes tecnologias como Grid Computing63, processamento In-Database64, anlise
In-Memory65 ou cloud computing66. Outro ponto j aplicar a anlise na entrada dos
dados para determinar sua relevncia com base no contexto. Estas anlises podem ser
usadas para determinar quais dados devem ser includos nos processos de anlise e
quais podem ser alocados em armazenamento de baixo custo de acesso posterior. De
acordo com a empresa SAS (o nome vem de statistical analysis system ou sistema de
anlise estatstica) 67, que oferece servios na rea de business analytics software e
servios, as organizaes tero que ser capazes de aproveitar os dados relevantes e
us-los para tomar as melhores decises, a exemplo do Big Data Analytics. Atravs
destes estudos possvel (SAS, 2011):

- Determinar as causas de falhas, problemas e defeitos, investigando as


sesses de usurio, logs de rede e sensores da mquina.
- Minerar dados de clientes para insights que impulsionam novas
estratgias de otimizao de campanhas, aquisio e reteno de clientes.
- Analisar milhes de SKUs (uma forma de cdigo de barras, de
localizador) para determinar os preos timos que maximizam os lucros e
mnimo inventrio.
- No Varejo, gerar cupons no ponto de venda com base em compras atuais
e passadas, garantindo uma maior taxa de converso.
- Enviar recomendaes personalizadas para dispositivos mveis no
momento certo, enquanto os clientes esto no local para aproveitar as
ofertas.
- Recalcular carteiras de risco inteiras em questo de minutos e
compreender as possibilidades futuras para mitigar o risco.
- Rapidamente identificar os clientes mais importantes.
- Analisar dados de mdias sociais para detectar novas tendncias de
mercado e mudanas na demanda.
- Usar a anlise de fluxo de cliques e de minerao de dados para detectar
comportamentos fraudulentos (SAS, 2011, traduo nossa) 68.

63
O grid computing um modelo computacional capaz de alcanar uma alta taxa de processamento dividindo as tarefas entre
diversas mquinas, podendo ser em rede local ou rede de longa distncia, que formam uma mquina virtual. Esses processos
podem ser executados no momento em que as mquinas no esto sendo utilizadas pelo usurio, assim evitando o desperdcio de
processamento da mquina utilizada. Disponvel em: http://en.wikipedia.org/wiki/Grid_computing. Acesso em 29 de janeiro de
2015.
64
O processamento In-Database muitas vezes se refere a anlise de banco de dados, a integrao de sistemas para o
armazenamento de dados. um mtodo muito utilizado por redes bancrias para a deteco de fraudes com cartes de crdito e
gesto de risco em investimentos. Disponvel em: http://en.wikipedia.org/wiki/In-database_processing. Acesso em 28 de janeiro
de 2015.
65
A anlise in-memory um recurso de armazenamento de grande volume de dados diretamente na memria principal dos
servidores. A grande diferena deste modelo de processamento de dados para o convencional que, anteriormente, estas
informaes eram arquivadas em discos rgidos, o que reduzia a agilidade na consulta pelas informaes em alta escala, j que
forava a memria do computador a realizar estas consultas. Disponvel em: http://www.artsoftsistemas.com.br/blog/entenda-
como-o-in-memory-computing-e-essencial-para-aproveitar-as-oportunidades-do-mercado. Acesso em 15 de janeiro de 2015.
66
O cloud computing refere-se utilizao da memria e das capacidades de armazenamento e clculo de computadores e
servidores compartilhados e interligados por meio da Internet, seguindo o princpio do grid computing. Disponvel em:
http://pt.wikipedia.org/wiki/Computao_em_nuvem. Acesso em 28 de janeiro de 2015.
67
http://www.sas.com/en_us/insights/big-data/what-is-big-data.html
68
Determine root causes of failures, issues and defects in near-real time, potentially saving billions of dollars annually. -
Optimize routes for many thousands of package delivery vehicles while they are on the road. - Analyze millions of SKUs to
determine prices that maximize profit and clear inventory. - Generate retail coupons at the point of sale based on the customer's
current and past purchases. - Send tailored recommendations to mobile devices while customers are in the right area to take
advantage of offers. - Recalculate entire risk portfolios in minutes. - Quickly identify customers who matter the most. - Use

52

Captulo I

Os desafios contemporneos envolvem grande volume de dados, como armazen-los,


como acess-los, quais contedos so relevantes e como us-los. Envolve as questes
de pblico e privado, em um cenrio em constante mudanas, aprendizado e
aperfeioamento. Prope-se o estudo da visualizao de dados no jornalismo digital
no momento de um jornalismo ps-industrial, no mais organizado consoante uma
lgica industrial em cascata produtiva; mas com marcas mais complexas: mais atores
atuantes, mais circularidade, mais algoritmos, mais inteligncia artificial, mais
computao em seu interior (BERTOCCHI, 2013, p. 10). As prticas jornalsticas se
atrelaram, portanto, as constantes mudanas sociais e tecnolgicas, tendo diversas
fases e formas de apresentao de contedos desde o surgimento do online. Os
modelos de negcios esto em adaptao, principalmente para serem sustentveis
num momento em que indivduos, instituies, empresas ou qualquer organizao
possuem o poder de mdia.

De acordo com o pesquisador brasileiro Caio Tulio Costa (2014), em pesquisa feita
juntamente com a Columbia University Graduate School of Journalism69, as empresas
jornalsticas esto pagando caro por terem descuidado dos investimentos em
tecnologias, pela falta de foco no desenvolvimento de produtos jornalsticos no
ambiente digital. (...) a web mudou a forma como organizamos a informao que
veio daquele formato claro dos livros e dos jornais, delimitado e slido, para algo de
consistncia parecida com o lquido, cujo fluxo livre e de possibilidades ilimitadas
(...). (COSTA, 2014, p. 84). A informao produzida por um jornal de qualidade
pode ser recortada, retrabalhada, reescrita e compartilhada de forma absolutamente
diferente, e at deformada, em relao ao seu contedo original. A problemtica
tambm se encontra em gerenciar as diferentes vises, principalmente as enraizadas
em prticas consolidadas ao ambiente analgico e com profissionais que tem pouca
experincia em processos digitais.

A indstria do jornalismo, seja por questes geracionais, seja por questes


de negcio, seja por mera incompetncia, levou muito mais tempo para
entender o momento disruptivo pelo qual passa do que levaram, por
exemplo, a indstria das telecomunicaes, que soube recriar-se no
ambiente sem fio; a indstria da msica, que est se refazendo no ambiente
digital; ou mesmo o varejo tradicional, que est se recuperando no
comrcio online. (COSTA, 2014, p. 61).

clickstream analysis and data mining to detect fraudulent behavior. SAS (2011). Big Data: what it is and why it matters.
Disponvel em: <http://www.sas.com/en_us/insights/big-data/what-is-big-data.html> Acesso em: 28 jan. 2015.
69
https://journalism.columbia.edu/

53

Captulo I

O negcio do jornalismo passa a ser mais do que contedo, mas tambm de


distribuio. Seu negcio a prestao de servios, com a integrao vertical de
contedo, reproduo e distribuio (COSTA, 2014, p. 55). A questo no somente
como aumentar a audincia, mas como fazer com que os internautas em rede se
dediquem aos seus contedos nas outras plataformas. E, o mais importante de tudo,
conseguir rentabilizar isso. (COSTA, 2014, p. 85). As receitas dos veculos
tradicionais ainda galgam caminhos para se consolidarem nas mltiplas formas de
atuao no online70. No entanto, para diversos autores do jornalismo ps-industrial, a
dicotomia entre lucratividade e independncia do jornalismo de qualidade no existe,
uma vez que o jornalismo sempre foi subsidiado de alguma forma. Uma das
caractersticas vivenciadas pelo jornalismo na atualidade, no chamado jornalismo ps-
industrial, so os efeitos disruptivos da Internet e das tecnologias de combinar
modelos de meios de comunicao num nico canal. Neste contexto, o jornalista
continua a fazer parte do sistema de informao; no mais como o seu principal ator,
porm, no menos importante.

(...) a sada que se antev para os modelos de negcios possveis nesta


nova realidade tem de levar em conta que o jornalismo deve continuar a
expor a corrupo, chamar a ateno para as injustias, cobrar polticos e
empresas pelas promessas e obrigaes assumidas, informar cidados e
consumidores, ajudar a organizar a opinio pblica, elucidar temas
complexos e esclarecer divergncias fundamentais ou seja, os jornalistas
no so apenas narradores de fatos (COSTA, 2014, p. 64).

Prestao de servio, pautas aprofundadas, contextualizadas, apresentadas de acordo


com as diferentes formas de cognio no ambiente digital. So diversos os desafios
para a prtica jornalstica e para a empresas de mdia na contemporaneidade. Neste
contexto, os profissionais no so necessariamente multitarefa, mas precisam ter
clareza de diversas competncias e saber trabalhar em equipe. Os trabalhos so cada
vez mais criativos, complexos e unem inmeros recursos como udio, vdeo e texto
em narrativas originais e no-lineares. Conhecer o leitor torna-se essencial em um
trabalho que se torna cada vez mais de nicho. Isso requer um conjunto de outras


70
Ns no vamos nos aprofundar neste estudo em modelos de negcio no jornalismo digital, mas h caminhos que esto sendo
adotados pelos veculos tradicionais de mdia, entre eles os de contedo paywall. Depois de 13 anos registrando resultados
negativos, os jornais The Times e Sunday Times, da Times Newspapers, por exemplo, apresentaram lucro no ano fiscal, encerrado
em junho de 2014. o primeiro resultado positivo desde a adoo do modelo de paywall, em 2010. Disponvel em:
http://www.meioemensagem.com.br/home/midia/noticias/2014/12/03/Times-e-Sunday-tem-lucro-apos-13-anos.html. Acesso em
28 de janeiro de 2015.

54

Captulo I

habilidades que tambm precisam ser aprendidas. Para Caio Tlio, a reviso dos
currculos acadmicos fundamental, pois mudou a forma de apreenso do
conhecimento. A escola de comunicao forma para textos e no para profissionais
multimdias. preciso entender novas cadeias, novas realidades (COSTA, 2014). De
acordo com ele, muito forte por parte dos veculos de mdia a incapacidade de
entendimento de uma nova relao, inclusive sobre o posicionamento das marcas
jornalsticas e modelos de negcio diante do cenrio diferenciado. A soluo
entender como as lgicas funcionam, como se do as relaes (COSTA, 2014)71.

Os autores Henry Jenkins, Joshua Green e Sam Ford mapearam no livro Spreadable
Media (2013), traduzido para o portugus, em 2014, sob o ttulo de Cultura da
Conexo, as mudanas que ocorrem no ambiente miditico contemporneo, espao
em que as empresas no controlam rigidamente sua distribuio de informaes e
muitos usurios esto diretamente envolvidos na circulao de contedo. Isso obriga a
reflexes sobre o modelo de distribuio de mdia que parte de um conceito j
consolidado para um espalhado, que instiga a todo instante novos posicionamentos de
empresas e de usurios diante da rede. A lgica da comunicao digital impe
tambm um pensar na perspectiva da audincia, o que as tecnologias oferecem e so
usadas pelas marcas, por exemplo. Para Jenkins, uma cultura da participao deve ser
reconsiderada e reposicionada integrando o conceito de re-elaborao de mensagens e
contedos, a chamada pervasividade ou mdia ubqua, como apontado por Saad
(2013).

A pervasividade ocorre quando contedos massivos so continuamente


reposicionados ao adentrarem em diferentes comunidades de nicho na
rede. Quando um material produzido segundo a lgica um para todos
ele resulta em inadequaes s necessidades de um dado pblico. Diante
disso, o pblico se v impelido a reajustar as mensagens conforme suas
necessidades informativas. (JENKINS: 2013, p.30).

A participao pervasiva pode gerar novos formatos miditicos em uma cultura


conectada, uma vez que estamos no mundo da comunicao digital, num
contemporneo onde ocorre a sobreposio de imagens, onde no h sentido no
esttico, onde muda-se o conceito de famlia e ocorre a desconstruo dos sentidos,


71
Na palestra de abertura do VII Congresso Nacional da ABCiber, realizado entre 3 e 5 de dezembro de 2014, na Escola
Superior de Propaganda e Marketing ESPM, em So Paulo, Caio Tlio ainda defende que para ele uma possvel soluo para
os veculos de mdia a unio para trabalhar com escala. Se unir para uma network.

55

Captulo I

momento que o filsofo Peter Sloterdijk denomina de Espumas72 (2004). No mbito


deste estudo, um momento onde tem-se a necessidade de aproximar produtos
jornalsticos diferenciados para um pblico participativo.

Em sntese, o perodo de transio, de diferentes formas de apreenso do


conhecimento e de apresentao da informao. Neste cenrio, a narrativa ps-
industrial adquire prticas diferenciadas, afinadas com o que o leitor quer e com o que
as tecnologias da atualidade proporcionam. Exige um trabalho muito maior do
profissional e investimentos em termos de recursos e equipe. A linguagem imersiva,
hipertextual, hipermiditica 73 , com inmeras fontes e correlao de dados. Para
Castells, (2003), a linguagem digital um cdigo bsico da comunicao da
sociedade em rede, onde a informao o principal fator da economia globalizada.

Jornalismo Digital de Base de Dados (JDBD) e o jornalismo de dados


Desde a dcada de 90 diversos estudos vem abordando as fases do jornalismo na


Internet (MIELNICZUK, 2003. BARBOSA, 2007, PALCIOS & MACHADO, 2003
entre outros). Nomenclaturas, novas prticas, adaptao de formatos analgicos no
ciberespao. Faremos as pontuaes de questes-chave, resgatando histricos para
termos a percepo do cenrio atual. O uso de dados no jornalismo digital tem seu
marco no que a pesquisadora Suzana Barbosa (2007) denomina como o quarto estgio
do jornalismo digital, marcado pela forte presena de bases tecnolgicas, acessos
expandidos via banda larga, proliferao de plataformas mveis, usos de algoritmos,
desenvolvimento de gesto de contedos mais consolidados, narrativas multimdia,
linguagem de programao, emprego de metadados, data mining (BARBOSA, 2007),
um cenrio que configura caractersticas especficas de um fazer jornalstico
especfico do ambiente online, onde as bases de dados se tornam um elemento
estruturante. Alguns estudos apontam que vivenciamos j a quinta fase, a dos usos das
mdias mveis para replicao de contedos e distribuio multiplataforma
(BARBOSA & TORRES, 2013).

72
No livro Esferas, volume III, Peter Sloterdjk analisa os indcios das novas conformaes da esfera em espaos sociais.
73
Nas consideraes da pesquisadora Lcia Santaella a hipermdia uma extenso do hipertexto, pois no se limita
informao escrita, mas permite acrescentar aos textos no apenas os mais diversos grafismos (smbolos matemticos, notaes,
diagramas, figuras), mas tambm todas as espcies de elementos audiovisuais (voz, msica, sons, imagens fixas e animadas).
(SANTAELLA, 2005, p. 24).

56

Captulo I

Entre as mais de vinte funcionalidades apontadas pelo Paradigma Jornalismo Digital


de Base de Dados (BARBOSA, 2007, 2013) esto: a integrao dos processos de
apurao, de composio, documentao e edio dos contedos; a orientao e o
apoio ao processo de apurao, coleta, e contextualizao dos contedos; a regulao
do sistema de categorizao e qualificao das distintas fontes jornalsticas, indicando
a relevncia delas; o uso de metadados para anlise de informaes e extrao de
conhecimento, por meio de tcnicas estatsticas ou mtodos de visualizao e
explorao como o data mining, usos de tagging74, a flexibilidade combinatria e o
relacionamento entre os contedos.

Dentro deste paradigma encontra-se o Jornalismo Guiado por Dados, data-driven


journalism ou como temos adotado prioritariamente neste estudo, jornalismo de
dados, um modelo que tem as bases de dados como definidoras da estrutura e da
organizao, bem como da composio e da apresentao dos contedos de natureza
jornalstica () (BARBOSA & TORRES, 2013, p. 154). Ele demarca a ampliao
das possibilidades de emprego das bases de dados no processo de produo de
contedos jornalsticos, no seu consumo e circulao (ibidem, p. 154). Entre as
categorias de dinamicidade, que marcam este novo padro (em contraposio aos sites
estticos) se encontra a visualizao de dados. A visualizao diz respeito aos modos
diferenciados para se representar informaes jornalsticas, a partir da sua
estruturao em base de dados.

Na dcada de 2000 em consequncia da fase de desenvolvimento alcanada pelo


jornalismo digital, pelos processos de open data e pelo barateamento dos processos
produtivos online, o jornalismo de dados passa a envolver tambm o manejo de um
grande volume de dados de forma automatizada e utiliza visualizaes, muitas vezes
interativas para encontrar notcias atrs dos dados, revelar verdades ocultas dentro de
tabelas pesadas ou base de dados. Entre as novidades das redaes que trabalham com
este tipo de jornalismo encontra-se a incorporao de um programador nas equipes.

Uma das novidades que existe sobre este assunto a incorporao de um


programador na construo das notcias. Isto algo completamente novo.
H cinco, seis anos, praticamente no existia. Hoje o programador se une a

74
Tagging vem da palavra tag, em portugus etiqueta, uma palavra-chave ou termo associado a uma informao que o descreve
e permite uma classificao da informao baseada em palavras-chave. Disponvel em:
http://pt.wikipedia.org/wiki/Tag_(metadados). Acesso em 28 de janeiro de 2015.

57

Captulo I

equipe de trabalho, a equipe de investigao, no desenvolvimento do que


se conhece como News Applications ou aplicaes de notcias. E existem
muitos produtos em matria de jornalismo de dados. H artigos baseados
em dados, visualizaes interativas, tem aplicaes de notcias, tem
conjunto de dados, catlogos de dados abertos e tambm blogs de dados
com sees dentro de alguns meios de comunicao. (CRUCIANELLI,
2014, traduo nossa)75

O jornalismo de dados visto como um processo de refinamento, onde dados brutos


so transformados em significado. (...) o valor para o pblico cresce, especialmente
quando fatos complexos so moldados em histrias claras, que as pessoas podem
facilmente entender (LORENZ, 2010, p. 12)76. Os processos de refinamento dos
dados representam a convergncia de diversos campos significativos em um processo
produtivo cada vez mais importante para as prticas jornalsticas digitais como o da
pesquisa investigativa, estatstica, design e programao. Para o jornalista e escritor
Paul Bradshaw, especializado em jornalismo de dados, a combinao dessas
habilidades resultam em histrias mais importantes e intimidadoras (BRADSHAW,
2010)77. Para ele, o processo de produo do jornalismo de dados pode ser dividido
em quatro etapas: primeiramente encontrar os dados por meio de conhecimentos, da
utilizao de computadores agregado a habilidades tcnicas especficas; em um
segundo momento a interrogao dos dados para se ter um bom entendimento do seu
meio, jarges e contexto em que se aplicam; em terceiro, mesclar as informaes e
dar visualizao aos dados por meio de infogrficos e outros recursos visuais; em
quarto, mesclar e apresentar os dados por meio de ferramentas prprias ou abertas.

Ao relacionar a reportagem tradicional, as narrativas com o desenvolvimento das


capacidades das bases de dados, com as convergncias de diferentes reas, o
jornalismo de dados representa uma forma diferenciada de jornalismo. A jornalista
Sandra Crucianelli (2014) aponta que neste jornalismo o objetivo encontrar as
prolas da notcia, contando para isso com ferramentas digitais para manusear os

75
Una de las novedades que hay en esta materia es la incorporacin de un programador a la mesa de noticias. Esto es algo
completamente nuevo. Hace 5 6 aos prcticamente no exista. Hoy el programador se une al equipo de trabajo, al equipo de
investigacin en la mesa de noticias para desarrollar lo que se conoce como News Applications Aplicaciones de Noticias. Y
hay muchos productos en materia de periodismo de datos. Hay artculos basados en datos, visualizaciones interactivas como les
deca, hay aplicaciones de noticias, hay set de datos catlogos de datos abiertos, pero tambin hay blogs de datos canales de
datos como seccin dentro de algunos medios de comunicacin (CRUCIANELLI, 2014) .
76
"() the value to the public grows, especially when complex facts are boiled down into a clear story that people can easily
understand" (LORENZ, 2010, p. 12).
77
"Data journalism is huge. I don't mean 'huge' as in fashionable - although it has become that in recent months - but 'huge' as in
'incomprehensibly enormous'. It represents the convergence of a number of fields which are significant in their own right - from
investigative research and statistics to design and programming. The idea of combining those skills to tell important stories is
powerful - but also intimidating. Who can do all that?" Disponvel em:
http://www.theguardian.com/news/datablog/2010/oct/01/data-journalism-how-to-guide. Acesso em: 10 de dezembro de 2014.

58

Captulo I

dados, muitas so ferramentas simples como o Google Advanced Search, a busca


avanada do Google78.

A prola que buscamos e que vamos buscar no fundo do mar encontramos


atravs de ferramentas muitas vezes conhecidas, mas pouco usadas, como
a Busca Avanada do Google. Sem dvida que esta ferramenta, atravs das
suas planilhas, nos oferece uma versatilidade enorme na hora de buscar por
formato, domnio e tambm por data. (CRUCIANELLI, 2014, traduo
nossa)79

Para Crucianelli, o jornalismo de base de dados rene as tcnicas do jornalismo


investigativo, jornalismo em profundidade, jornalismo de preciso, jornalismo
analtico e reportagem assistida por computador80. Em um dos mdulos do curso de
Ferramentas de Dados para Jornalistas de Dados, Crucianelli (2014) define que:

- Jornalismo investigativo requer trs condies necessrias para que uma


reportagem possa ser investigativa. Deve se tratar de um tema de relevncia social,
que aborde questes que algum quer manter em segredo e, finalmente, requer o
trabalho habitual do jornalista. So casos onde so investigadas corrupes,
administrao de dinheiro pblico, entre outras81.

- Jornalismo de profundidade o mesmo que o jornalismo investigativo, s que


nestes casos no se precisa manter segredo sobre o que o jornalista investiga. Pode ser
um estudo das variveis sobre a pobreza em relao aos dados do censo82, por
exemplo.

- Jornalismo de preciso formulado na dcada de 60 pelo professor Philip Meyer,


78
Disponvel em: www.google.com.br/advanced_search.
79
La perla que buscamos y que vamos a bucear hacia el fondo del mar la encontramos a travs de una herramienta en algunos
casos muy conocida, pero poco usada, que es la Bsqueda Avanzada de Google. Sin dudas que esta herramienta a travs de su
plantilla nos ofrece una versatilidad enorme a la hora de buscar por formato, por dominio y tambin por fecha.
(CRUCIANELLI, Sandra. Curso Masivo y Abierto en Lneas - Herramientas Digitales para Periodismo de Datos. Realizado em
2014, promovido pelo Centro de Knigth para el Periodismo en las Amricas).
80
Diante da vasta referncia sobre o assunto ns no vamos nos aprofundar em cada uma destas definies. Por ora os registros
ficaro por conta de Crucianelli (2014).
81
Periodismo de Investigacin (PI): Se requieren 3 condiciones necesarias para que un reportaje se precie de ser investigativo.
Se trata de un tema de relevancia social a lo que se aade que alguien pretende mantener en secreto; finalmente, se requiere un
trabajo adicional del periodista, ajeno a las prcticas cotidianas de cobertura informativa. Son los casos en los que se investigan
asuntos relacionados con irregularidades en la administracin del dinero pblico, como casos de corrupcin, as como cuando se
revelan situaciones de ineficiencia o abuso por parte de compaas de servicios pblicos privatizadas o toda aquella que cause
una afectacin a la sociedad, como podra ser un caso de delito ecolgico (CRUCIANELLI, 2014).
82
Periodismo de Profundidad (PP): Es lo mismo que el PI; solo que en este caso nadie intenta mantener en secreto lo que el
periodista investiga. Como podra ser un estudio sobre las variables de pobreza sobre los datos de los censos nacionales
(CRUCIANELLI, 2014).

59

Captulo I

envolve o uso de mtodos da investigao social aplicados ao jornalismo em


investigaes qualitativas (anlises de casos, grupos focais, anlise de discurso, etc) e
quantitativas. Esta ltima inclui a descritiva (quando se consideram todos os casos:
exemplo, um censo entre legisladores) e o que se denomina de investigao
inferencial, ou seja, quando se trabalha com um universo e dada a dificuldade de
abordar cada membro desse universo se desenha uma amostra representativa do todo,
o que passa a ser um estudo projetado. Isto aplica-se a processos de votao onde h
previses, indicativos de inteno de votos83.

- Jornalismo analtico analisa uma realidade complexa, com a finalidade de alcanar


a compreenso do pblico. Combina alguns aspectos do jornalismo investigativo. Sua
misso oferecer provas baseadas em interpretaes da realidade, explicando-as de
um modo compreensvel. Contextualiza um assunto, descrevendo os detalhes
histricos e dados estatsticos. o resultado de uma explicao completa, destinada a
dar forma a percepo do pblico sobre o fenmeno. Destina-se a coleta de dados
dspares e a fazer conexes que no so imediatamente aparentes. Sua eficcia na
anlise entre os fatos e no os prprios fatos. Usa um pilar de visualizao chamado
Sistema de Informao Geogrfica (GIS)84.

- Jornalismo assistido por computador ou reportagem com auxlio de computador se


define como qualquer processo que utiliza a assistncia de computadores durante a
relao e processamento de dados. Baseia suas prticas no uso de folhas de clculos
de Excel para a anlise de informao contidas em planilhas85.

Em relao aos produtos jornalsticos de dados, Sandra Crucianelli (2014) aponta que


83
Periodismo de Precisin (PPr): Formulado como disciplina en la dcada del 60 por el profesor Philip Meyer, involucra el uso
de mtodos de la investigacin social aplicados al periodismo tales como la investigacin cualitativa (anlisis de casos, Grupos
Focales, Anlisis del discurso, etc.) y la investigacin cuantitativa. Esta ltima incluye la descriptiva (cuando se consideran todos
los casos: ejemplo, un censo entre legisladores) y lo que se denomina investigacin inferencial, es decir cuando se trabaja sobre
un universo y dada la dificultad para abordar a cada miembro de ese universo, se disea una muestra representativa de ese
universo, a la cual se procede a poner bajo estudio. Es el caso de las encuestas de opinin o las electorales con fines predictivos
(CRUCIANELLI, 2014).
84
Periodismo Analtico: Analiza una realidad compleja, con el fin de lograr la comprensin del pblico. Combina algunos
aspectos del periodismo de investigacin y la informacin explicativa. Su misin es ofrecer pruebas basadas en interpretaciones
de la realidad, explicndolas de un modo comprensible. Contextualiza un tema de fondo, mediante la descripcin de detalles
histricos y datos estadsticos. El resultado es una explicacin completa, destinada a dar forma a la percepcin del pblico del
fenmeno. Aspira a recoger datos dispares y hacer conexiones que no son inmediatamente evidentes, y su eficacia es a menudo
en el anlisis entre los hechos y no en los hechos mismos. Utiliza como pilar de la visualizacin los llamados SIG, Sistemas de
Informacin Geogrfica (CRUCIANELLI, 2014).
85
Periodismo Asistido por Computadora: Conocido en ingls por sus siglas (CAR: Computer Assisted Reporting): se define
como "cualquier proceso que utiliza la asistencia de computadoras durante la recoleccin y procesamiento de datos. Ha basado
su prctica en el uso de hojas de clculo de Excel, para el anlisis de informacin contenidas en tablas (CRUCIANELLI, 2014).

60

Captulo I

h pelo menos seis diferentes que surgem desta prtica:

- Artigos baseados em dados geralmente so artigos curtos, construdos a partir de


grande volume de dados como os que poderiam estar contidos em uma base de dados
ou o conjunto de dados desenhados a partir de vrias bases de dados;

- Visualizaes interativas em geral so um complemento dos artigos baseados em


dados e podem ser reunidos em si mesmos sem necessidade de que exista um artigo
referencial. Em alguns casos suficiente um ttulo, abaixo um subttulo e uma
explicao para a audincia sobre como ler os dados da visualizao;

- Conjunto de dados abertos os meios de comunicao no necessariamente se


voltam para a realizao de trabalhos jornalsticos baseados em dados. Alguns optam,
como no caso do La Nacin, da Argentina, por dedicar uma grande parte de seu
esforo na cobertura de iniciativas governamentais open data. Este trabalho comea a
se expandir em pases onde existem leis de acesso a informao pblica e onde estas
leis no funcionam como deveriam. Os dados ficam confusos, em planilhas
desconexas, e muitas vezes, em formatos no acessveis via web 86 . Nestas
circunstncias, os meios de comunicao podem dedicar esforos no trabalho com
dados e certamente iro fazer grandes contribuies.

- Aplicaes de notcias conhecidas em ingls como News Apps. No jornalismo,


com a presena de programadores informticos, so criados aplicativos que podem
permitir, por exemplo, agrupar e analisar variveis, buscas por rea geogrfica, por
data, nomes de empresas, etc.

- Blogs de dados podem publicar contedos contendo um ou todos os itens j


citados porm no formato blog;

- Canais de dados equivalem a uma seo dentro de um meio digital. Os canais de


dados incluem notas, blogs, catlogos, aplicaes de notcias, etc.


86
No prximo captulo abordaremos as questes legislativas no cenrio brasileiro.

61

Captulo I

Para o jornalista norte-americano Philip Meyer (1991), a disponibilidade de


computadores nas redaes e usos de bases de dados tornaram o jornalismo muito
mais prximo de um mtodo cientfico na sua produo. Ele defende a teoria no
primeiro captulo do livro The New Precision Journalism:

A disponibilidade crescente de computador fez com que grandes


quantidades de informao se tornassem acessveis aos jornalistas de um
modo que antes no era possvel. E, nos escritrios, o fracasso de
circulao dos jornais fez com que os editores prestassem uma ateno
mais sistemtica ao mercado e aos fatores que motivavam os leitores a
gastar tempo e dinheiro com as publicaes. A noo de que o jornal um
produto e que o leitor uma criatura racional, que toma a deciso de pagar
ou no por um produto, se tornou respeitvel. E ento as foras do
mercado pressionaram o jornalismo como um todo, no somente alguns
profissionais isolados, a uma postura mais cientfica (MEYER, 1991,
traduo nossa)87.

O aumento da disponibilidade de dados traz questes sobre como melhor apresentar


essas informaes para o pblico e como fazer isso sem que seja necessrio ao
jornalista um vasto conhecimento em linguagens de programao, tecnicidades e
cincias avanadas.

Jornalismo de dados: entre o senso comum e a cincia

O jornalista e professor Philip Meyer props na obra Precision Journalism


(Jornalismo de Preciso), em 1969, o uso de tcnicas quantitativas das cincias sociais
nas reportagens. A ideia era unir os recursos da sociologia com a rapidez de clculo
dos computadores e com isso obter abordagens mais precisas e objetivas. Neste meio
entre senso comum e saber cientfico, o pesquisador Marcelo Trsel (2013) aponta
que o senso comum baseado na experimentao direta dos fenmenos atravs dos
sentidos e que o saber cientfico a sistematizao e ordenao dos fenmenos.


87
"The increasing availability of computers made large bodies of data available to journalists in a way that was not possible
before. And in the business office, the failure of newspaper circulation to keep up with the growth in number of households made
publishers pay more systematic attention to the marketplace and the factors that motivated readers to spend time and money with
the publishers' products. The notion that a newspaper is a product and that a reader is a rational creature who makes a choice
about whether to pay the cost of using the product became respectable. And so market forces were pushing journalism as a
whole, not just a few isolated players in the field, to a more scientific stance" (MEYER, 1991). Disponvel em: Disponvel em:
http://www.unc.edu/~pmeyer/book/Chapter1.htm . Acessado em 10/12/2015.

62

Captulo I

O conhecimento de (senso comum) pode ser compartilhado apenas


parcialmente pela linguagem, enquanto no conhecimento acerca de
espera-se uma universalidade (cincia). O conhecimento concretizado em
forma de notcias se situaria em algum ponto do continuum entre o senso
comum e a cincia. Seria um tipo de senso-comum transformado por
tcnicas narrativas num conhecimento de comunicvel a toda uma
sociedade (...) (TRSEL, 2013, p. 4).

A notcia, portanto, informa e orienta e a falta de rigor analtico muitas vezes


aproximava o jornalismo mais do senso comum. O jornalismo de preciso e na
atualidade o jornalismo de dados visam o outro extremo, uma aproximao s
cincias atravs do uso de tecnologias e mtodos de anlise. Para Philip Meyer
(1991), o jornalismo vivencia em seu cotidiano foras que visam torn-lo somente
entretenimento, publicidade e relaes pblicas. A Reportagem Assistida por
Computador (RAC), por exemplo, o oposto:

O que os praticantes do CAR (sigla em ingls de Reportagem Assistida


por Computador) esto fazendo, - conscientemente ou no, um padro
mais elevado do truthtelling. Nossa resposta para a era da informao
tem sido a de aprender a gerenciar grandes massas de informaes com
ferramentas de anlise cada vez mais poderosas, levando a uma definio
mais exata da verdade. Os computadores tem sido teis para auxiliar
nisso. Mas o computador em si no o objetivo, nem define o que
estamos tentando fazer. (MEYER, 1999, p.1, traduo nossa.)88.

A visualizao de dados, tendo como um de seus elementos formadores o RAC,


adquire as mesmas caractersticas de distanciamento do censo comum e
aprofundamento de contedo, porm utilizando recursos tcnicos para lidar com o
grande volume e velocidade de dados aliados a estatsticas e muitas vezes aos olhares
dos estudos sociais na interpretao dos fenmenos. Em resumo, h semelhanas em
fazeres jornalsticos e estudos sociais, antropolgicos, principalmente no que diz
respeito a um jornalismo investigativo, na coleta, mapeamento e tratamento de um
grande volume de dados que podem vir a representar comportamentos da sociedade.
A Antropologia, por exemplo, reflete sobre o universo simblico da ao e a estrutura


88
Journalism today is in a battle for survival against the forces that would merge it with entertainment, advertising, and public
relations. The information age has created such a confusing buzz of voices that it tempts us all to sacrifice almost anything for
attention including truth. What the practitioners of CAR have been after whether consciously or not is a higher standard of
truthtelling. Our response to the information age has been to learn to manage larger bodies of information with increasingly
powerful analytic tools, leading to a more exact definition of truth. As it happens, a computer is helpful in doing that. But the
computer itself is not the goal, nor does it define what we are trying to do (MEYER, 1999 p. 1).

63

Captulo I

do tecido social, contribuindo no s com tcnicas de anlise, mas com novos olhares
para o jornalisticar. Distanciando-se e aproximando-se do objeto e de vises
cientficas, o jornalista um profissional que lida com todo o processo informativo:
apurao, anlise, sntese e transmisso de dados.

As ferramentas de computao agilizam o trabalho de fazer correlaes entre dados


sejam eles estruturados ou no. Trabalhando com a percepo visual contribuem com
anlises e expanso da capacidade de raciocnio. Por isso o jornalismo de dados tem
sido visto como uma forma de reportagem com grande potencial para o cumprimento
da misso de defesa do interesse pblico. No entanto, os dados podem ser somados,
comparados e integrados entre si, complementando os grandes blocos de texto que o
computador s consegue mostrar, mas no correlacionar. Esta competncia fica a
cargo do profissional, do jornalista, da equipe responsvel pelo contedo jornalstico.
Partindo da Antropologia Visual89, as tecnologias atuais se constituem como um
prolongamento das capacidades humanas, formas de instrumentao cientfica da
modernidade para decifrar culturas. As tecnologias digitais tornam-se parte da
memria que coletam, armazenam, organizam e comunicam uma grande quantidade
de informao, em diferentes extenses e formatos. Para a pesquisadora Amber Case
(2010), a tecnologia est nos evoluindo, formando uma nova verso do homo sapiens
que confiam em crebros externos (telefones celulares e computadores) para se
comunicar. No so extenses do eu fsico, mas de um eu mental.

Voc um ciborgue toda vez que olha para a tela de um computador ou


usa um celular, porque est entrando numa relao tecno-social com um
pedao de tecnologia no-humana. Nossos celulares, carros e laptops
tornaram-se ciborgues porque ns os empregamos para fazer coisas que
no conseguimos como simples indivduos. Nossos corpos podem estar
nos mesmos lugares, mas nossas identidades e pensamentos esto viajando
pelo globo (CASE, 2010).

No livro The Future of Antropology (2006), a pesquisadora Sarah Pink aborda que
houve uma exploso de mdias visuais nos ltimos anos, uma gama de tecnologias
visuais e digitais que transformaram a investigao e anlise visual. Ela aponta como
resultado uma abordagem interdisciplinar de grande potencial dentro e fora da


89
A antropologia visual um ramo da antropologia cultural, aplicada ao estudo e produo de imagens, nas reas da fotografia,
do cinema ou, desde os meados dos anos 1990, nos novos media utilizados em etnografia. Fonte Wikipdia. Disponvel em:
http://pt.wikipedia.org/wiki/Antropologia_visual. Acesso em 10 de junho de 2014.

64

Captulo I

academia. Argumenta que esse potencial pode ser aproveitado atravs das concepes
da Antropologia Visual em contextos mais amplos, incluindo:

O aumento do uso de mtodos de pesquisa visuais atravs das cincias


sociais e humanas;
O crescimento da popularidade do visual como metodologia e objeto de
anlise dentro da antropologia e da antropologia aplicada
O crescente interesse na antropologia dos sentidos e antropologia da
mdia
O desenvolvimento de novas tecnologias visuais que permitem aos
antroplogos trabalhar com novas formas. (PINK, 2006, traduo nossa).

O futuro da visualizao dos dados depende em parte, de como os seus


praticantes vo se envolver com as novas mdias visuais e digitais, com os
avanos tecnolgicos. De acordo com Sarah Pink tornam-se essenciais para os
pesquisadores trs fases de uma anlise visual: produo, contedo e contexto de
consumo. Onde so revelados vrios processos de produo e relaes que envolvem
diferentes configuraes de indivduos e instituies. Contedo e design tambm so
elementos importantes na forma de apresentao e representao da comunicao
hipermdia, relacionando principalmente teoria e experincia numa estratgia para se
alcanar os objetivos. O consumo de igual importncia, uma vez que fundamental
pensar sobre como o trabalho foi recebido e qual o seu impacto com o pblico. Ao
combinar imagem, som e escrita com a relao de sentidos preciso se envolver com
as epistemologias, de como essa experincia construda; saber a melhor forma de
explorar e de analisar os diferentes aspectos da experincia humana atravs de
diferentes meios de comunicao. preciso repensar o visual em mltiplos nveis de
engajamento e diversos pblicos, atentando para os desafios que surgem a partir da
experincia e da representao.

Qual a viso e como ela opera tanto como uma experincia corporal
como uma categoria cultural em diferentes contextos sociais e culturais?
Alm disso, como so as relaes especificamente culturais entre viso e
outras categorias sensoriais construdas e como so relacionadas as
convenes culturais e as intervenes humanas para quebr-las ou
modific-las? Em segundo, tal repensar exige interrogar os nossos mtodos
e meios de comunicao visual em pesquisa, seus usos para examinar a
relao entre (udio) visual e outros meios de comunicao (como a
escrita, desenho, mdia digital, arte de instalao, performance). Como tal,
a Antropologia Visual pode ser redefinida no apenas como a antropologia
do visual e do uso de mtodos visuais na pesquisa e na representao, mas
como a antropologia da relao entre os elementos visuais e outras formas
de cultura, a sociedade, a prtica e a experincia e a prtica metodolgica

65

Captulo I

combinando meios de comunicao visual e outras na produo e


representao do conhecimento antropolgico (PINK, 2006, p. 143,
traduo nossa)90.

Sociedade complexa, recursos tecnolgicos nunca vistos e vividos. Para o fazer


jornalismo de dados, para a compreenso do social, so necessrios novos olhares,
uso de mtodos de pesquisa e diferentes formas de apresentao dos dados que
facilitem o conhecimento por parte do pblico.

Consideraes

Este primeiro captulo teve por objetivo fazer uma contextualizao do jornalismo
contemporneo, onde ele se encontra, assim como onde esto os estudos do
jornalismo digital no que diz respeito ao grande volume de dados. Buscamos de forma
ampla, a partir da Comunicao, situar o contexto do objeto de estudo proposto
inserindo-o num cenrio com mais rigor cientfico, com demandas de
contextualizao aprofundada, em uma linguagem imersiva, dinmica, com a
proximidade de outras reas de pensamento e investigao.

Pontuamos, ao longo do captulo, a distino entre dado e informao e entre


visualizao de dados e visualizao da informao. Deixamos claro nosso desafio
nesta pesquisa de focar no em um resultado final, mas na compreenso sobre como
os processos se estabelecem no mbito deste manuseio de dados e metadados. Para
ns a visualizao de dados um processo no-linear, trabalhado no jornalismo de
dados que se encontra em rea fronteiria de estudo, mas possuindo caractersticas
prprias que o distingue de outras prticas. Ele um jornalismo visual, investigativo,
de preciso, analtico, de profundidade, que envolve as tcnicas do RAC e que
emerge a partir da congruncias e manuseio de grandes volumes de dados. Nos


90
What is vision and how does it operate as both an embodied experience and a cultural category in different social and cultural
contexts? Moreover, how are culturally specific relationships between vision and other sensory categories constructed and how
are these related to cultural conventions and human agency to break or change them? Second, such a rethinking requires that we
interrogate our uses of visual methods and media in research, to examine the relationship between (audio) visual and other media
(such as writing, drawing, digital media, installation art, performance). As such, visual anthropology might be redefined as not
simply the anthropology of the visual and the use of visual methods in research and representation, but as the anthropology of the
relationship between the visual and other elements of culture, society, practice and experience and the methodological practice of
combining visual and other media in the production and representation of anthropological knowledge (PINK, 2006, p. 143).

66

Captulo I

concentramos, prioritariamente, no fator tecnolgico como um dos pr-requisitos para


estudar as peas jornalsticas que sero exploradas no captulo V e que acreditamos
que vo nos ajudar a sustentar a resposta da pergunta-problema desta pesquisa: o que
a visualizao de dados no jornalismo? Como ela se insere na prtica e na narrativa
do jornalismo de dados proporcionando diferenciais relevantes?

Como chegamos a abordagem da visualizao de dados no sentido trabalhado


nesta pesquisa? De forma visual, nosso esquema poderia ser descrito desta
forma:
Figura I. 5 Esquema conceitual da visualizao de dados nesta pesquisa

Big Data




Design Comunicao

Computao
Estatstica
(programao)
- visual;

- investigativo;

- de preciso;
Jornalismo de
- analtico;
dados
- RAC;
- de profundidade.


Visualizao de

dados





Infogrficos,
Visualizao da mapas,
Informao ferramentas
interativas, etc.


Fonte: Mayanna Estevanim, 2016.

67

Captulo I

Dentro de um cenrio Big Data, o jornalismo de dados, que adota elementos do


jornalismo investigativo, visual, de preciso, analtico, da Reportagem Assistida
por Computador e de profundidade, se relaciona com outras reas para lidar
com o grande volume, velocidade e variedade de dados. Estas reas so a
Comunicao, a Computao, o Designer, e a Estatstica (prioritariamente).
Entre seus recursos, o jornalismo de dados adota a visualizao de dados como
formato para interpretar as informaes (visualizar as informaes) e apresent-
las em narrativas inovadoras, seja a partir de infogrficos, mapas, geolocalizao
ou ferramentas interativas.

Nos prximos captulos, partimos do olhar de que a visualizao de dados um


formato que recorre utilizao de softwares de processamento de dados que esto
envolvidos nas camadas de dados e metadados do sistema narrativo, traduzindo
complexidades de dados e suas correlaes atravs de modelos visuais. As bases de
dados no necessariamente aparecero ao usurio/leitor, uma vez que podem servir
apenas como fonte para a produo de contedos jornalsticos, alm de apresentaes
infogrficas, mapas, entre outros recursos visuais. Para ns a visualizao aqui um
meio de transformar dados em informao semntica, criando ou no ferramentas
para que qualquer pessoa faa a leitura e interpretao de um processo informativo.

68

Captulo II

II. A ENTREVISTA AOS DADOS



Resumo: O segundo captulo tem como meta exemplificar o jornalismo de dados e a
visualizao para, a partir da sua presena no cotidiano, discutir as questes tericas e
apontar os caminhos para construes noticiosas que partem de base de dados. Tendo
como o foco no cenrio brasileiro, apontar a influncia das questes polticas e de leis
de transparncia que interferem na produo e disseminao da usabilidade na web e
da prtica do jornalismo de dados no pas.

Palavras-chave: base de dados, visualizao de dados, jornalismo de dados brasileiro




Saber codificar e decodificar tecnocdigos, para contar histrias, dever
ser muito em breve uma necessidade bsica de todos (Ligia Maria Prezzi
Lemos, 2013, em seminrio sobre a obra de Vilm Flusser)91.

A avalanche de informaes

No ano de 1854 uma epidemia de clera ocorreu na cidade de Londres, Reino Unido
(UK) contabilizando mais de 500 vtimas fatais num perodo de apenas 10 dias. O
bairro de Soho reuniu um grande nmero de moradores contaminados. O principal
foco de transmisso da doena foi uma bomba dgua onde os moradores e
transeuntes enchiam seus vasilhames. O mdico Jonh Snow se destacou na
investigao dessa epidemia ao reunir os registros de cada vtima e onde elas
residiam, quais trajetos faziam diariamente e representar isso atravs de um mapa com
o objetivo de identificar padres de contgio. Desta forma ele conseguiu mostrar
indcios fortes de que a doena no seria transmitida pelo ar, mas sim pela gua e
especificamente que aquele surto partia de um poo.


91
Realizado dia 11 de junho de 2013, na disciplina Comunicao e redes na era digital: pensamento contemporneo e tendncias
tecnolgicas, ministrada pela professora doutora Elizabeth Saad, na Escola de Comunicao e Artes USP.

69

Captulo II

Figura II. 6 Mapa de Snow, 1854.


Fonte: JOHNSON, 2008, p. 117

Snow realizou um intenso trabalho de investigao de campo, foi nas reas onde
ocorriam a maior parte das mortes; fez diversas entrevistas com moradores da
localidade e de reas prximas, observou a relao das mortes que ocorriam em reas
mais afastadas e ao visualizar as conexes descobriu que a maioria das pessoas se
concentravam em torno de um poo de gua localizado na Broad Street. Com este
mapa, Snow foi considerado um dos pioneiros nos estudos sobre epidemiologia.

Em seu formato original, apresentado ao pblico em um encontro da


Sociedade Epidemiolgica (...) cada morte foi representada por um grosso
trao preto, o que proporcionava um vvido destaque s casas que sofreram
uma quantidade significativa de perdas, e o excesso de detalhes foi
eliminado, preservando-se unicamente o traado bsico das ruas e os
smbolos que representavam as treze bombas d'gua que abasteciam a

70

Captulo II

vasta rea do Soho. O impacto visual do mapa era impressionante. (...) Era
possvel observar que onze bombas d'gua no apresentavam casos de
clera nas proximidades (...) quando se enfatizava a imagem da bomba de
Soho, o mapa ganhava uma sbita clareza. O clera no se estendia
difusamente sobre o bairro. Irradiava-se, na verdade, a partir de um nico
ponto. (JOHNSON, 2008, p. 77).

A criao do mapa filtrando somente as variveis que importavam para combater o


problema sintetizou a complexidade presente no cenrio e favoreceu o conhecimento
atravs da representao visual. O que fortaleceu esse modelo de visualizao no
foi exatamente a tcnica de mapeamento empregada, mas sim a cincia por trs da
representao, ou seja, a inteno explcita de amplificar a capacidade de cognio do
observador (RIBEIRO, 2009, p. 40). O trabalho de Jonh Snow foi rduo e revelador.
De 1854 at os dias atuais foram inmeras as transformaes, sejam nas formas de
investigao de epidemiologias, no armazenamento dos dados ou na digitalizao dos
mesmos, o que possibilita diferentes olhares sobre a sociedade em seus mais diversos
aspectos. Falamos aqui de processamentos e correlaes de bancos de dados que so
humanamente impossveis de serem mensurados de forma manual, principalmente se
atentarmos para o fato de que estamos na casa dos yottabytes92 de dados.

Voltando o nosso olhar para o jornalismo, entre os exemplos que associam a


comunicao em rede (diante de um grande volume de dados) e o jornalismo
investigativo no Brasil, se encontra o SwissLeaks 93 , uma investigao sobre o
gigantesco esquema de evaso fiscal onde o banco multinancional britnico HSBC
tinha conhecimento e facilitava as aes atravs de uma de suas subsidirias na sua,
o HSBC Private Bank Suisse. Nestas aes, o banco teria obtido lucros ao abrigar
dinheiro de sonegadores fiscais e outros transgressores de leis. O trabalho de
investigao foi coordenado pelo Consrcio Internacional de Jornalistas
Investigativos ICIJ (sigla em ingls de International Consortium of Investigative
Journalists94) e envolveu mais de 160 jornalistas em 55 pases incluindo Frana,
Estados Unidos, Sua e Brasil. Os jornalistas revelaram que 180,6 bilhes de
euros foram movimentados em contas mantidas no HSBC, em Genebra, oriundas de
todo o mundo, entre novembro de 2006 e maro de 2007. Estas contas representavam

92
Um yottabyte (1024) equivale a 250 trilhes de DVDs de dados, mas j se falam nos BrontoBytes de dados (1027) no universo
digital.
93
Entre as fontes, informaes iniciais podem ser obtidas em: https://pt.wikipedia.org/wiki/Swiss_Leaks;
http://fernandorodrigues.blogosfera.uol.com.br/2015/03/12/leia-tudo-sobre-o-caso-swissleaks-hsbc-no-brasil/.
94
https://www.icij.org/index.html

71

Captulo II

mais de 100.000 clientes e 20.000 empresas offshore95. Os registros apontavam que


do montante, 8.667 eram correntistas brasileiros, que totalizavam depsitos em cerca
de US$ 7 bilhes. O Brasil foi o 4o pas em nmero de clientes envolvidos.

Figura II. 7 Globo.com, matria A distribuio dos clientes e valores do "Swissleaks", 2015.

Fonte: Jornal O Globo, 2015.

Um dos infogrficos interativos apresentados na imprensa96 mostrou a distribuio


dos clientes por pases e valores no declarados. O resultado foi obtido atravs do
cruzamento de bancos de dados originados de arquivos roubados do HSBC Private
Bank por um ex-funcionrio, o engenheiro de software Herv Falciani. Estes mesmos
arquivos foram entregues s autoridades da Frana no final de 2008 e tambm para


95
Uma empresa offshore uma empresa registrada em um pas que oferece um sistema fiscal particularmente vantajoso ou at
mesmo inexistente, desde que a atividade no seja realizada no territrio de registro da empresa. As empresas offshore tm trs
caractersticas principais: primeiro, elas devem ser registradas na jurisdio escolhida. Em segundo lugar, o cliente deve ser
domiciliado fora da jurisdio de registro. Em terceiro lugar, a empresa deve realizar todos os seus negcios fora da sua
jurisdio de registro, se no seria considerado como uma empresa "residente" e portanto, tributados como tal. A maior parte das
pessoas associa o termo "empresa offshore" como sendo uma forma de otimizar o sistema tributrio da empresa. Fonte:
http://pt.sfm-offshore.com/faq-empresaoffshore.html#S0. Acesso em 15 de dezembro de 2015.
96
Disponvel em: http://infograficos.oglobo.globo.com/brasil/a-distribuicao-dos-clientes-e-valores-do-swissleaks.html. Acesso
em 11 de dezembro de 2015.

72

Captulo II

diversas autoridades de outros pases, entre elas a brasileira (que em um primeiro


momento negligenciou a informao). Nosso objetivo aqui aprofundar um pouco
mais o olhar a este exemplo para perceber a dimenso do cenrio de dados
investigado, o impacto do manuseio dessas informaes para o jornalismo de dados e
para a sociedade.

O passo--passo

A anlise dos cerca de 60 mil arquivos sobre as contas bancrias passou por diversas
etapas e contou com a experincia de quem j vinha lidando com denncias e um
grande volume de dados. A jornalista americana Jessica Weiss (2015), que faz parte
da Rede de Jornalistas Internacionais IJNet conversou com a vice-diretora do
Consrcio Internacional de Jornalistas Investigativos, Marina Walker Guevara e com
a jornalista de dados Mar Cabra, da mesma instituio, sobre como foi este trabalho
em escala global97. Primeiramente os dados foram recebidos pelo ICIJ que teve o
cuidado de examin-los e fazer listas regionais e nacionais de nomes e clientes para
tornar mais fcil o trabalho para os reprteres locais. Somente alguns meses depois foi
convocada uma reunio presencial, de um dia, no jornal Le Monde, em Paris, com
todos os reprteres que faziam parte do projeto.

O programador Rigoberto Carvajal esteve a frente dos dados em um primeiro


momento e foi quem escreveu um programa para extrair informaes simples dos
arquivos para serem convertidas em um banco de dados. Estas informaes foram
repassadas aos reprteres para que tivessem algo palpvel para iniciar os trabalhos. A
comunicao entre os participantes ocorreu a partir de um software de rede social de
cdigo aberto chamado Oxwall, que foi personalizado pelo ICIJ e renomeado de
Voyager. De acordo com Mar Cabra, para os dados foram utilizadas duas plataformas
de cdigo aberto.

Para pesquisas de documento usamos a plataforma de busca Solr de cdigo


aberto, o que nos permitiu categorizar e fazer o upload dos vazamentos em
uma plataforma segura, e ento permitiu que os reprteres pesquisassem os
vazamentos usando palavras-chave, pas, ano e outras variveis. Alm do


97
Disponvel em: https://ijnet.org/pt-br/blog/como-o-icij-fez-uma-investiga%C3%A7%C3%A3o-transfronteiri%C3%A7a-
colaborativa-e-em-grande-escala. Acesso em 05 de janeiro de 2016.

73

Captulo II

Solr, tambm usamos Blacklight, que uma interface de usurio que


tornou a ferramenta mais fcil de usar (CABRA apud WEISS, 2015).

Alm dos desafios operacionais para a construo do banco de dados prprio, os


desafios jurdicos do projeto estiveram presentes durante todo o processo, uma vez
que estavam lidando com questes delicadas, onde no podiam haver erros neste
banco de dados. O manuseio com os dados, a chamada limpeza que envolve o
agrupamento por familiaridade e excluses, trouxe para os jornalistas envolvidos na
investigao a percepo de que as conexes emergentes entre os dados e as pessoas
eram a parte mais importante. Por isso foi criada uma ferramenta de cdigo aberto,
denominada Linkurious, que permitiu a conexo direta das pessoas aos dados. Foi
necessria a elaborao de um manual sobre como usar as plataformas, assim como
treinamentos online para mostrar aos jornalistas como ler os arquivos. Para as
comunicaes entre os envolvidos foi utilizado um servio de e-mail chamado
Hushmail.

De acordo com Marina Walker Guevara as conquistas foram notveis principalmente


pela unio de esforos entre redaes que passam por crises econmicas. Nenhuma
redao at agora - exceto talvez o New York Times e alguns outros - tm a
capacidade de fazer algo grande como este em uma escala global (GUEVARA apud
WEISS, 2015).

Compartilhar no um instinto de jornalistas -- simplesmente no a


maneira que ns tradicionalmente trabalhamos. Mas ns incentivamos
isso. Estamos tentando mudar a forma como funciona o jornalismo
investigativo, porque achamos que isso como ele pode e deve ser no
futuro. [Profissionais de] negcios, a polcia, criminosos -- j esto todos
trabalhando de forma colaborativa. Como jornalistas, ns somos os
nicos que estamos atrs (GUEVARA apud WEISS, 2015).

Em fevereiro de 2015, foi divulgada na pgina do ICIJ a informao sobre as contas


na Sua, com o ttulo de Swiss Leaks: Murky Cash Sheltered by Bank Secrecy98. No
Brasil, o UOL iniciou a participao em fevereiro deste mesmo ano em seguida o
Jornal O Globo se integrou a iniciativa. O jornalista Fernando Rodrigues, do UOL e o


98
Swiss Leaks: dinheiro escuso protegido pelo sigilo bancrio (traduo nossa).

74

Captulo II

jornalista Chico Otvio, do Globo, estiveram envolvidos na investigao que no total


divulgou 500 nomes de brasileiros. Em palestra realizada no 10o Congresso
Internacional de Jornalismo Investigativo da Abraji, Associao Brasileira de
Jornalismo Investigativo99, em 2015, os dois deram detalhes sobre a investigao que
esteve durante 6 meses concentrada somente com programadores no processo de
depurao das contas e formao de um banco de dados nacional prprio com o uso
da ferramenta Linkurious. A partir desse processo foi possvel perceber a teia de
relaes, transferncias de dinheiro, transferncias de quem para quem e foram
adotados os critrios de divulgao e escolha dos nomes que estariam nas matrias
nacionais.

Para a vertente brasileira do caso foi montada uma editoria temporria parte nos
veculos envolvidos. Primeiramente o objetivo era entender quais os limites legais
para ter contas fora do pas. Foram feitas diversas perguntas aos dados e a diferentes
fontes at que fosse formado um banco de dados interno. Foram necessrias criaes
de contas, provedores especficos para se ter mais segurana contra invases de e-
mails e cibercrimes100 no perodo de investigao. A checagem das informaes foi
diria e aos poucos foram elaborados os critrios de seleo. A minerao envolvia a
leitura de nomes que estavam incompletos e por isso foi preciso o cruzamento com
datas de aniversrio e outras correlaes para conseguir chegar aos nomes que foram
escolhidos pelos critrios de relevncia jornalstica combinada com interesse pblico.
Em suma, pessoas que tinham exposio pblica, que verbalizavam opinio,
influenciavam a sociedade e que viviam dessa exposio pblica.

Primeiramente foi feito o rastreamento dos correntistas brasileiros (priorizando os que


tinham registros de fraudes pblicas). Aqueles que haviam declarado Receita
Federal e que o Banco Central tinha conhecimento sobre as contas no exterior saram
desta lista. No entanto, menos de 10%, dos mais de 8 mil nomes, tinham estes
esclarecimentos prestados. Todos os nomes reunidos nesta lista de 500 pessoas foram
contactados e informados sobre as divulgaes que iriam acontecer e foram

99
Palestra proferida em 2 de julho de 2015, na Universidade Anhembi Morumbi, na Vila Olmpia, em So Paulo.
100
Cibercrime (Cybercrime em ingls) a palavra dada a uma prtica que consiste em fraudar a segurana de computadores ou
redes empresariais. Este crime pode ser promovido de diversas maneiras: disseminao de vrus que coletam e-mails para venda
de mailing; distribuio material pornogrfico (em especial infantil); fraudes bancrias; violao de propriedade intelectual e
direitos conexos ou mera invaso de sites para deixar mensagens difamatrias como forma de insulto a outras pessoas.
Disponvel em: https://pt.wikipedia.org/wiki/Cibercrime. Acesso em 25 de abril de 2016.

75

Captulo II

convidados a prestar esclarecimentos. Diversos advogados surgiram e ligaes foram


feitas diretamente para a diretoria dos veculos solicitando esclarecimentos.

De posse dos nomes, a divulgao aconteceu por temas, entre eles de pessoas
envolvidas em escolas de samba, no mundo do esporte, artistas, empresrios. A
divulgao foi coletiva, pois havia um acordo assinado entre os jornalistas dos
diversos pases envolvidos no consrcio. O banco de dados constitudo pelas equipes
de mdia no foi disponibilizado para os rgos pblicos, somente partes dele para
esclarecimentos, uma vez que a preocupao jornalstica tambm incidiu sobre
aqueles que estavam na legalidade e, portanto, tinham direito a privacidade.
Advogados criminalistas alegaram origem ilegal da prova e os desdobramentos sobre
o caso correm na justia.

A investigao SwissLeaks foi demorada, envolveu um grande nmero de pessoas e


teve como suporte o conhecimento do jornalismo investigativo aliado aos recursos
tecnolgicos e anlises estatsticas para lidar com o volume de dados na
contemporaneidade. Como resultando, teve a construo de bancos de dados prprios
de cada pas envolvido e inmeras repercusses nos mais diferentes formatos. Com a
digitalizao das informaes e com a possibilidade de manusear estes conjuntos de
dados, o trabalho jornalstico foi dimensionado, ganhou escala e profundidade em
relao aos dados. O que est de acordo com a nossa viso de que as maneiras e
finalidades de utilizao da prtica de visualizao de dados so diferenciadas e
envolvem aspectos culturais, de acessibilidade de regulamentaes. Por isso, vamos
nos aprofundar no cenrio nacional como meio de entender particularidades do
processo.

Visualizao de dados no jornalismo digital brasileiro

Como apontado no primeiro captulo, para ns a visualizao de dados o


aproveitamento do agenciamento entre as camadas de dados e metadados no mbito
do sistema narrativo, o qual privilegia a apresentao visual relevante e de impacto
(BERTOCCHI, 2013, p. 180). um formato que recorre utilizao de softwares de

76

Captulo II

processamento de dados que no necessariamente aparecem ao usurio/leitor, uma


vez que os resultados finais podem ser construes narrativas a partir dos dados
obtidos, como infografias, mapas, entre outros101. Variveis em relao as equipes
envolvidas, desenvolvimento de softwares prprios, recursos em geral e
principalmente disponibilidade de tempo de execuo e entrega dos contedos aos
leitores. Como o jornalismo nacional vem se apropriando da visualizao de dados e
das prticas do jornalismo de dados? A partir de uma observao no-participante
desde janeiro de 2014, em decorrncia do ingresso do mestrado em Cincias da
Comunicao na Universidade de So Paulo, ns distinguimos, em um primeiro
momento, trs principais reas que trabalham a visualizao de dados em mbito
nacional: os veculos tradicionais de mdia, as iniciativas independentes e os
laboratrios acadmicos.

Entre os exemplos nacionais, o Blog Estado Dados102, do Jornal O Estado de S.


Paulo, um veculo tradicional de mdia que possui uma equipe prpria para trabalhar
com jornalismo de dados. O blog apresenta tanto reportagens, quanto projetos em
visualizao de dados e criou a ferramenta chamada Basmetro103 que permite medir
o desempenho dos governos e dos deputados brasileiros. O resultado final
apresentado ao leitor neste projeto foi uma infografia interativa104 que utiliza como
recursos visuais uma timeline com bolas, linhas e porcentagem para medir a taxa de
governismo (medio do apoio ou no dos deputados ao governo) do parlamentar a
partir da recuperao interna das bases de dados do sistema construdo.

Voltaremos aos exemplos do Estado Dados no captulo 5, inclusive aprofundando


questes especficas do Basmetro.

Figura II. 8 Estadaodados.com, projeto Basmetro, 2008.


101
O foco deste artigo o cenrio nacional, mas as publicaes em mbito internacional so avanadas e inovadoras no
jornalismo digital. O jornalista americano Josh Stern publicou um post no seu blog intitulado Groundswell com as reportagens
que foram destaque no jornalismo em 2014. Elas utilizaram storytelling, recursos de udio, vdeo, satlites, sensores, imerso. O
post The Best Online Storytelling and Journalism of 2014, est disponvel em http://stearns.wordpress.com/2015/01/05/the-best-
online-storytelling-and-journalism-of-2014/. Acesso em 12 de janeiro de 2015.
102
http://blog.estadaodados.com
103
http://estadaodados.com/basometro/
104
A palavra infografia vem do ingls informational graphics e consiste em utilizar ferramentas visuais como mapas, tabelas,
desenhos, ilustraes, legendas, combinadas com texto no intuito de transmitir ao leitor informaes de fcil compreenso
(CAIRO, 2004, DE PABLOS, 1999),.

77

Captulo II


Fonte: Jornal O Estado de S. Paulo, blog Estado Dados, 2008.

Outro exemplo brasileiro o Hacks Hackers105 SP, um grupo independente que une
pessoas de diversas reas em aes colaborativas para explorar tecnologias de
filtragem e visualizao de informaes. O grupo busca diferentes maneiras de contar
histrias no jornalismo. Eles realizam as denominadas hackatonas, eventos que
renem programadores, designers, jornalistas e pesquisadores em torno de dados
pblicos, sobre ideias de visualizao da informao e monitoramento de propostas j
iniciadas. Cada evento conta com uma temtica e parcerias, a exemplo do Hack
d'guaSo Paulo: dados e sensores para informar sobre a crise hdrica106, que conta
com o Instituto Socioambiental 107 e a equipe do Lab (InfoAmaznia 108 &Mapas
Coletivos109) como facilitadores, apresentando trabalhos j desenvolvidos tanto na
visualizao de dados, quanto em sensores para a medio da qualidade da gua.
Figura II. 9 Encontro Hack d'guaSo Paulo, 2014

105 http://hackshackers.com. Outras informaes tambm esto disponveis em: http://www.meetup.com/Hacks-Hackers-Sao-
Paulo/.
106
http://www.meetup.com/Hacks-Hackers-Sao-Paulo/events/206050432/
107
https://www.socioambiental.org/pt-br
108
http://infoamazonia.org/pt/#!/map=49&loc=-5.659718554577286,-61.25976562499999,5
109
http://www.mapascoletivos.com.br/

78

Captulo II


Fonte: Hacks Hackers, 2014110.

O prximo exemplo atrela o jornalismo, a visualizao de dados e os estudos de


anlise de redes. Ele vem do Laboratrio de Estudos sobre Internet e Cultura do
Departamento de Comunicao da Universidade Federal do Esprito Santo
(LABIC/UFES) 111 . Como a prpria descrio da sua pgina na web diz, um
laboratrio que tem como proposta a realizao experimental de produtos digitais e a
promoo de pesquisas e atividades de extenso sobre o impacto da cultura digital nos
processos e prticas de comunicao contempornea. O grupo formado por
jornalistas, programadores, universitrios, entre outros. A cartografia A longa jornada
do #MarcoCivil: da letargia do Parlamento ao efeito Snowden, foi um trabalho que
utilizou o software livre Gephi 112 , uma plataforma interativa de visualizao e
explorao de dados em grafos113. A anlise props a trajetria das discusses sobre o
#MarcoCivil114 nas redes sociais.


110
http://www.meetup.com/Hacks-Hackers-Sao-Paulo/events/206050432/
111
http://www.labic.net
112
O Gephi pode ser baixado gratuitamente no https://gephi.org.
113
Um grafo pode ser compreendido como a representao grfica de uma rede se valendo de elementos como ns (pontos de
conexo) e arestas (conexes entre os ns). (DI FELICE, Massimo, TORRES, Julliana C. e YANAZE, Leandro K. H. Redes

79

Captulo II

Figura II. 10 Labic.net, cartografia A longa jornada do #MarcoCivil, 2012



Fonte: Labic/UFES, 2012

A equipe do laboratrio registrou, em 2012, 22 mil tweets somente com a hashtag


#MarcoCivil. Destes, foram separadas as mensagens que viralizaram na rede, um total
de 5 mil retweetes. Com a leitura dos retweets, as mensagens mais viralizadas, por
diferentes atores, se concentrava em controvrsias em torno de: questes polticas,
efetivao da lei, neutralidade da rede, liberdade de expresso, direito autoral, direito
do consumidor, cibercrimes e privacidade. A partir disso, com estudos tcnicos sobre
atribuies de cores e arestas, foram criados grficos sobre a diversidade de
controvrsias, as oscilaes diante dos novos acontecimentos, como adiamento da
votao. Foi em 2013, que de acordo com o estudo, a rede deixou de ser de ativistas,
polticos e especialistas e se popularizou. Esta popularizao foi ajudada pela entrada
em cena da rede contrria #NoVaiTerMArcoCivil, pela realizao das jornadas de

digitais de sustentabilidade: As interaes com o meio ambiente na era da informao. So Paulo: Annablume. 2012).
114
O Marco Civil da Internet a lei que regula o uso da Internet no Brasil (previso de princpios, garantias, direitos e deveres
para quem usa a rede, alm dos usos por parte do estado esto entre a abrangncia da lei).O projeto surgiu em 2009, mas foi
somente no primeiro semestre de 2014 que ele foi sancionado. Informaes sucintas podem ser encontradas em
http://pt.wikipedia.org/wiki/Marco_Civil_da_Internet. Acesso em 07 de janeiro de 2014. Aprofundaremos as questes sobre o
Marco Civil no decorrer deste estudo.

80

Captulo II

junho115 e pela divulgao da espionagem eletrnica que o governo dos EUA foi
denunciado por praticar116. Em todo este percurso possvel ver como a rede reagiu a
cada fato novo.

A partir dos exemplos apresentados neste captulo possvel perceber que h
diferentes apropriaes, tcnicas, mtodos de trabalho e anlise diante de um universo
de opes de designs e fontes de dados. Entre os pontos em comum temos o trabalho
em equipe que envolve pessoas de diversas reas, mas que nas redaes jornalsticas
se concentram principalmente entre jornalistas, estatsticos, programadores e
designers. possvel perceber que dentro das variveis, h caractersticas inerentes
ao jornalismo de dados. De imediato as caractersticas que envolvem: a formao
das equipes, a temporalidade na produo dos contedos e as distintas fontes,
que acabam por envolver tambm a expertise dos profissionais envolvidos na
coleta dos dados.

Caractersticas inerentes

Equipes

O Estado Dados tem um ncleo hoje formado por quatro profissionais: um


coordenador, dois jornalistas e um estatstico. Na hackatona da gua estiveram
presentes 43 profissionais das mais diferentes reas. O Labic contava, em 2015, com
o envolvimento de 20 profissionais, num trabalho multidisciplinar envolvendo
pessoas dos departamentos de Cincias da Comunicao, Computao, Design,
Matemtica e Antropologia para fazer a anlise das redes sociais e navegar desde a
cibercultura, passando pelos movimentos de rede at a esttica contempornea. No
caso do SwissLeaks houve o agrupamento de profissionais de diferentes empresas de
comunicao em um consrcio. Falamos, portanto, de um trabalho em equipe, com
pessoas com diferentes competncias.


115
Protestos realizados no Brasil em 2013, tambm conhecidos como Manifestaes dos 20 centavos, Manifestaes de Junho ou
Jornadas de Junho. As manifestaes populares aconteceram em vrias regies do Brasil e foram iniciadas para contestar o
aumento da tarifa do transporte pblico.
116
Edward Joseph Snowden um analista de sistemas que trabalhou na Central Intelligence Agency (CIA) dos Estados Unidos e
tambm na Agncia de Segurana Nacional (ANS) Americana, que denunciou o sistema global de vigilncia feito pelo governo
americano.

81

Captulo II

Tempo de produo

No h um tempo definido para a consolidao do banco de dados, correlaes e


produo das peas jornalsticas. Como em boa parte das vezes, o trabalho se
assemelha ao do jornalismo investigativo podendo demorar dias ou meses. A lgica
completamente diferente dos processos das redaes tradicionais de jornalismo que
trabalham a atualizao cotidianamente.

Alguns veculos de comunicao tem modificado sua rotina mesmo no trabalhando


diretamente com jornalismo de dados e visualizao de dados. No fim de maro de
2016, por exemplo, o jornal britnico Times117 anunciou que no publicaria mais
notcias em tempo real tanto no site, quanto no aplicativo. As atualizaes, com
exceo de notcias urgentes, acontecem agora duas ou trs vezes ao dia. O objetivo
do jornal dar mais profundidade a assuntos considerados relevantes118. No prximo
captulo abordaremos questes referentes ao valor-notcia e a inovao, que talvez
possam ser justificativas para mudanas como esta.

Fontes dos dados

A escolha das fontes, a seleo de informaes e o formato da narrativa so prticas


comuns no jornalismo independentemente da digitalizao. Na contemporaneidade,
os dados so oriundos de polticas de transparncias, dados divulgados pelos governos
e instituies sociais nas mais diferentes extenses. Alm dos dados das redes sociais,
coletados em tempo real. Ou, no caso do Labic, a partir de uma ferramenta prpria
elaborada para coletar dados da rede feita posteriormente aos acontecimentos,
principalmente no Twitter.

Em 2014, em artigo apresentado no IV Congresso Internacional de Jornalismo


Obciber, em Portugal119, foram pesquisados os principais jornais das capitais do
Brasil 120 como forma de contextualizao do uso de visualizao de dados e


117
http://www.thetimes.co.uk/
118
Disponvel em: https://labmidiacombr.wordpress.com/2016/05/04/breaking-news-nao-pera-ai/. Acesso em 5 de maio de 2016.
119
RAMOS, Daniela; SPINELLI, Egle; ESTEVANIM , Mayanna. Formatos digitais e qualidade no jornalismo brasileiro em
base de dados, 2014. Disponvel em: https://cobciber4.files.wordpress.com/2015/04/cobciber4atas.pdf. Acesso e, 2 de junho de
2015.
120
Foram buscados os jornais catalogados no site: http://www.guiademidia.com.br/jornais-brasileiros.htm.

82

Captulo II

infografia no jornalismo online brasileiro. A observao aconteceu nos dias 15 e 16


de setembro de 2014 diretamente no endereo eletrnico de veculos de comunicao.
Foram observados sites e portais de notcia que apresentaram contedo produzido
especialmente para o formato online. Foram selecionados quatro jornais,
aleatoriamente, de cada capital, totalizando, na primeira observao, 108 veculos. Em
um segundo momento foram buscadas sees dados ou infografia nas pginas dos
veculos. Dos 108 observados em apenas cinco veculos de cinco Estados (Gois, Rio
Grande do Sul, Cear, So Paulo e Rio de Janeiro) foram encontrados blogs ou abas
sobre o assunto (RAMOS et al. 2014, p.4):

na regio centro-oeste, o jornal Dirio de Gois apresenta a seo


Infogrfico121;
na regio sul, o jornal Zero Hora, de Porto Alegre apresenta o blog Livre
Acesso122;
na regio nordeste, o jornal O Povo, no Cear apresenta a seo Infogrfico123;
na regio sudeste, o Correio do Brasil, no Rio de Janeiro, apresenta a seo
Pesquisa e Infogrficos124;
tambm na regio sudeste, em So Paulo, os quatro veculos visitados
apresentaram sees dados ou infografia;
Folha de S. Paulo blog Folha SP Dados, que se encontra desativado125;
o portal G1 apresenta a seo Infogrficos126;
Estado de S. Paulo apresenta a seo Infogrficos 127 e o blog Estado
Dados128;
portal IG apresenta a seo especial Infogrficos129.

Foram verificadas nesta amostra um total de 8 veculos, sendo 1 da regio centro-


oeste, 1 da regio sul, 1 da regio nordeste, 5 da regio sudeste sendo que destes, 4
estavam na capital paulista. Isso no quer dizer que no existam reportagens,
infografias, oriundas de grandes bases de dados em outras sees. Por isso, a partir

121
http://diariodegoias.com.br/infogrficos
122
http://wp.clicrbs.com.br/livreacesso/
123
http://www.opovo.com.br/infograficos/
124
http://correiodobrasil.com.br/noticias/pesquisas-e-infograficos/
125
http://folhaspdados.blogfolha.uol.com.br (desativado)
126
http://g1.globo.com/infograficos/index.html
127
http://www.estadao.com.br/infograficos/
128
http://blog.estadaodados.com
129
http://especiais.ig.com.br/infograficos/

83

Captulo II

deste cenrio nacional, foi buscada a Associao Brasileira de Jornalismo


Investigativo (Abraji) que realiza um levantamento de reportagens guiadas por dados
publicadas no Brasil. A iniciativa da Abraji visa criar um banco pblico de referncias
nacionais. Qualquer pessoa pode contribuir inserindo reportagens em uma planilha
aberta130, com contedos oriundos de diferentes plataformas incluindo sites, revistas,
jornais impressos, entre outros. Nas contribuies feitas at o dia 13 de outubro de
2014 constavam 63 reportagens entre os anos de 2009 e fevereiro de 2014. Em
relao s editorias especiais voltadas para jornalismo de dados, a Abraji identificou 5
jornais, sendo 3 da regio sudeste (O Globo, Estado Dados e Folha de S. Paulo), um
da regio sul (Zero Hora) e um da regio nordeste (Gazeta do Povo). O que foi
perceptvel, a partir do estudo destas reportagens, que diversas eram baseadas em
dados, mas no em base de dados.

O que se observa no jornalismo de dados o uso de bases de dados pblicas,


privadas, prprias das organizaes jornalsticas como centro da criao. Contedos
que definem a estrutura, a organizao e a apresentao dos contedos jornalsticos, a
partir de categorias especficas. Bases de dados que permitem a atualizao e
publicao. Como os pesquisadores Suzana Barbosa e Vincius Torres apontam, um
jornalismo que demarca a ampliao das possibilidades de emprego das bases de
dados no processo de produo de contedos jornalsticos, no seu consumo e
circulao (BARBOSA & TORRES, 2013, p. 154).

H diversas ferramentas sendo desenvolvidas para cada vez mais ter preciso no
resultado de buscas, principalmente utilizando os recursos da Web Semntica (WS).
Os caminhos percorridos para se chegar a compra de um determinado produto, quanto
tempo se demora em cada site, que tpicos foram acessados, as conversas em redes
sociais digitais. Assuntos que podem ser coletados e mapeados tendo as mais
diferentes fontes no universo web onde toda e qualquer ao no ambiente digital deixa
rastros.

Como afirma Berners-Lee (1998), a web semntica um esforo que o


homem faz para ajud-la a mquina a compreender os documentos na
rede e em rede. A WS tem sido nomeada de diversas formas, sendo a
definio de plataforma a mais comumente encontrada na literatura
cientfica e nos meios de comunicao especializados em tecnologia e

130
A planilha est disponvel no endereo http://www.abraji.org.br/?id=90&id_noticia=2717

84

Captulo II

informtica, ao lado de conjunto de aplicativos inteligentes, tecnologias


inteligentes e extenso da web atual (BERTOCCHI, 2013, p. 135).

Na linguagem humana uma palavra pode assumir diversos significados, mas na


linguagem dos computadores essa ambiguidade no est prevista. Os softwares
computacionais no conseguem fazer tantas distines e para que se consiga so
necessrios metadados, anotaes semnticas. (...) as camadas de antenarrao do
sistema narrativo que trabalham com metadados e as linguagens de marcao podem
proporcionar um ambiente digital jornalstico desambiguado, ou seja, contribuem
para o fortalecimento de uma Web Semntica (BERTOCCHI, 2013, p. 136). O
desafio dela fornecer uma linguagem que expresse tanto dados quanto regras de
raciocnio sobre estes dados e que permita que as regras existentes sejam entendidas
por qualquer sistema de representao de conhecimentos presentes na Web.
(BERNERS-LEE, HENDLER & LASSILA, 2001)131.

Para Tim Berners-Lee, James Hendler e Ora Lassila, autores do artigo The Semantic
Web - A new form of Web content that is meaningful to computers will unleash a
revolution of new possibilities (2001)132, a percepo das potencialidades da web
semntica acontecer a partir da apropriao e criao de muitos programas, por parte
das pessoas, que resultem em coletas de contedos da web a partir de diversas fontes.
Onde ocorra o processamento da informao e sejam feitos intercmbios dos
resultados com outros programas.

Ao falar de jornalismo de dados, jornalismo em base de dados e visualizao de


dados, ainda abordamos um universo restrito em usos cotidianos no cenrio brasileiro.
Por mais que a programao esteja presente em todo o processo informacional
(apurao, produo e apresentao), muitas vezes o conhecimento em linguagem de
programao e estatstica, por parte dos jornalistas, acaba sendo um limitador de
pautas diante de um grande volume de dados. Veremos ao longo da pesquisa que a
questo do tempo e dos recursos econmicos so tambm grandes complicadores para

131
The challenge of the Semantic Web, therefore, is to provide a language that expresses both data and rules for reasoning about
the data and that allows rules from any existing knowledge-representation system to be exported onto the Web (BERNERS-
LEE, HENDLER & LASSILA, 2001). Disponvel em: http://www-
sop.inria.fr/acacia/cours/essi2006/Scientific%20American_%20Feature%20Article_%20The%20Semantic%20Web_%20May%2
02001.pdf. Acesso em: 20 de julho de 2014.
132 Disponvel em: http://www-
sop.inria.fr/acacia/cours/essi2006/Scientific%20American_%20Feature%20Article_%20The%20Semantic%20Web_%20May%2
02001.pdf.

85

Captulo II

o desenrolar em escala da prtica. Por enquanto vamos nos ater a um dos aspectos
desta trade (que no necessariamente o maior problema).

O jornalista tem duas grandes barreiras de linguagem a transpor. Uma a


da estatstica e da capacidade de interpretar dados. A outra a da
competncia tcnica, ou seja, o jornalista precisa aprender a escrever
cdigo. Todo jornalista precisa entender, mesmo que em um nvel
elementar o que um cdigo, qual a sua funo e como se comunicar com
gente que entende da coisa (ANDERSON, BELL & SHIRKY , 2012, p.
50).

H diversos programas que surgiram nos ltimos anos para auxiliar no trabalho de
coleta dos dados, assim como diversos cursos online e presenciais para capacitar os
profissionais envolvidos133. O Instituto Brasileiro de Pesquisa e Anlise de Dados
divulgou uma lista com ferramentas para anlise de redes e grafos em mdias
sociais134. O Outwit Hub135, por exemplo, utilizado para realizar a raspagem de
dados e o Google Refine136 para a limpeza dos dados. No entanto, mesmo com a
presena de aplicativos e ferramentas, preciso um mnimo de conhecimento, da
expertise jornalstica para encontrar o que rende boas pautas, fazer as perguntas certas
aos dados e de entender que mesmo as ferramentas tambm possuem limitaes. O
Outwit Hub e o Google Refine, por exemplo, tornam-se problemticos quando se
precisa fazer uma tarefa grande e repetitiva por semanas ou meses.

Como visto, h diversas maneiras de manusear os dados que vo alm do uso de


ferramentas e aplicativos. H hierarquias de processos que podem ser automatizados
por meio de programao de robs. O jornalista Rodrigo Burgarelli, do blog Estado
Dados, defende a existncia de pelo menos trs tipos de usos de programao no
jornalismo: o primeiro a anlise de dados, que a compreenso do que eles
realmente significam e onde muitas vezes utilizada a linguagem R137. O segundo uso
diz respeito a raspagem ou scrapping de dados, que a captura de informaes no
estruturadas que esto em pginas da Internet e a organizao das mesmas em banco
de dados ou tabelas. Neste momento, tem-se utilizado com frequncia a linguagem


133
Abordaremos um pouco mais sobre eles no V captulo desta pesquisa.
134
A quem interessar, vale uma visita pgina uma vez que o objetivo desta pesquisa discutir outras questes que englobam os
processos da visualizao de dados. Disponvel em: http://blog.ibpad.com.br/index.php/2015/12/26/ferramentas-para-analise-de-
redes-e-grafos-em-midias sociais/?utm_medium=redesads&utm_source=fb&utm_campaign=arssp01&utm_content=65. Acesso
em 7 de janeiro de 2016.
135 https://www.outwit.com/products/hub/
136
Informaes disponveis no blog Online Journalism, em: https://onlinejournalismblog.com/tag/google-refine/.
137
R uma linguagem e tambm ambiente de desenvolvimento integrado para clculos estatsticos e grficos.

86

Captulo II

Python. Por fim, o terceiro uso que diz respeito a visualizao, que a apresentao
deste trabalho ao leitor. Esta apresentao pode ser feita via infogrficos, aplicativos
interativos, que podem ser feitos com HTML ou Java Script (BURGARELLI apud
FREITAS & PINTO, 2015)138. Para Burgarelli, ao ter noes sobre programao, a
pessoa entende a lgica e o conceito da atividade passando a ter mais ideias de
trabalhos.

O programador Luciano Ramalho, do Garoa Hacker Clube 139 , que tem grande
proximidade com o jornalismo por ter passado pelas redaes do Brasil Online, UOL,
AOL Brasil, defende que mesmo os jornalistas que no trabalham diretamente com
jornalismo de dados devem atentar para o cenrio tecnolgico contemporneo. Devem
se preocupar com formatos e armazenamento dos seus textos. Para ele, o jornalista
deve escrever pensando que o texto ser um dado para diversos formatos, com uma
produo e armazenamento de informao compatvel para qualquer fim. Apesar de
no existir um padro, a escrita digital em notao menos perecvel do que a feita
em plataformas que podem ter sobrevivncia datada, como no World ou Facebook.
A obsolescncia programada, por exemplo, pode ocorrer com o software
proprietrio, mas o software livre sempre ter outras formas de resgate (RAMALHO,
2015, anotaes). Ramalho acrescenta ainda, que para ele o jornalismo digital no
Brasil s no melhor porque ns no sabemos fazer (ibidem, 2015).

Experincia narrativa e usabilidade

No dia 6 de abril de 2016 o Instituto Brasileiro de Geografia e Estatstica (IBGE)


divulgou140 parte da Pesquisa Nacional por Amostra de Domiclios (PNAD) com dados
sobre o uso de tecnologias da informao pelos brasileiros. De acordo com a pesquisa, o
acesso Internet pelo celular subiu, de 53% em 2013 para 80% em 2014. J o acesso a
Internet pelo computador apresentou queda, em 2013 era 88% e em 2014 diminuiu para


138
http://portalintercom.org.br/anais/nacional2015/resumos/R10-3036-2.pdf
139
https://garoa.net.br/wiki/P%C3%A1gina_principal
140
Disponvel em: http://g1.globo.com/jornal-hoje/noticia/2016/04/internet-pelo-celular-ultrapassa-acesso-computador-segundo-
ibge.html. Acesso em 5 de maio de 2016.

87

Captulo II

76%. Pela primeira vez nas pesquisas brasileiras o acesso Internet pelo telefone celular
ultrapassou o acesso via computador141.

O desafio das redaes jornalsticas contemporneas so inmeros. No defendemos


aqui que jornalistas devam programar cdigos ou que as mquinas contaro histrias
melhor que os reprteres, mas as possibilidades de contar as histrias foram
ampliadas nos meios digitais. Isto significa experimentaes e diferentes usos em
oportunidades de comunicar melhor. So pelo menos quatro os canais por onde
passam as narrativas (seja a criao de produtos ou servios): primeiramente pelo
modelo tradicional impresso que permanece em exerccio; em segundo pela web nas
telas do computador; em terceiro pelos dispositivos mveis como as telas de
aparelhos celulares e em quarto pelas telas de dispositivos mveis de maior porte,
como os tabletes. So diversos os caminhos para manter e atrair um pblico leitor a
partir de formatos ricos que envolvem narrativas com maior interatividade, muitas
inseridas em processos de dados e metadados, como o caso do foco desta pesquisa
(abordaremos melhor este assunto no prximo captulo).

Concordando com as pesquisadoras da Universidade de So Paulo, Daniela Bertocchi,


Stefanie Silveira e Isadora Camargo (BERTOCHI et. al 2015), no jornalismo, a
experincia narrativa comea a ser discutida quando so definidas estratgias de
produo de formatos para mltiplos dispositivos. So necessrias solues de
usabilidade e design para os produtos levando em considerao no somente os
elementos textuais presentes nas interfaces grficas, mas tambm a arquitetura de
informao que ser decisiva na experincia do usurio final. A narrativa passa a ser
vista tambm como uma articulao de dados e metadados em formatos com um
propsito determinado. No uma juno de camadas computacionais soltas, pelo
contrrio, possui camadas que so interligadas. A camada dos dados, da database,
uma camada estrutural, mas no a nica a definir as regras do sistema. A narrativa
como sistema um conjunto complexo, artificial, no qual atuam distintos atores
humanos e no-humanos e que produz um todo maior que suas partes (BERTOCCHI
et al. 2015, p. 79). Sendo necessria a compreenso das suas camadas e dos elementos


141
Com relao ao nmero de casas com acesso Internet, em 2013, este nmero correspondia a pouco menos da metade. J em 2014,
quase 55% das casas tinham acesso Internet.

88

Captulo II

contidos no processo de contar as histrias, de trabalhar o elo entre o contedo, os


usurios e a cognio.

Fica ainda o dilema sobre o que fazer diante dos diversos canais: a melhor experincia
para o usurio aquela que oferece uma interface digital adaptada a cada tela, a
chamada responsividade ou interfaces digitais distintas e elaboradas para cada um dos
dispositivos mveis? Agora, se por um lado temos a questo de mudanas no fazer e
pensar jornalstico agregando cada vez vais recursos computacionais, por outro
tambm esto presentes as questes polticas e de regulamentao da Internet e uso
de dados no Brasil. Alm da usabilidade, regulamentaes das conexes em rede e as
polticas de transparncia interferem no incentivo, no letramento digital e nas
apropriaes dos dados. Impactos em toda a sociedade. Privacidade, votao do
Marco Civil e neutralidade da rede so algumas dessas discusses e conectar estes
assuntos nos levam a uma maior compreenso sobre o terreno e as diversas facetas da
visualizao de dados no jornalismo brasileiro.

Cenrio poltico e discusses sobre a Internet

Quais as principais discusses sobre o uso de dados no Brasil? Como elas impactam
no jornalismo de dados e na visualizao de dados? O Brasil tem seus diferenciais em
relao a outros pases que devem ser abordados para a melhor compreenso do todo
e que interferem no objeto de estudo proposto nesta pesquisa. Nesta paisagem onde a
digitalizao modifica a maneira como as pessoas se relacionam com outras pessoas,
com produtos e com contedos; onde empresas buscam mapear o seu pblico
consumidor; instituies acadmicas visam conhecer os atores sociais e seus
comportamentos a partir do digital, governos em todo o mundo tendem a aumentar a
transparncia disponibilizando dados referentes administrao pblica sob licenas
abertas (open data). No Brasil, o acesso a informao est previsto na Constituio
Federal e na Declarao Universal dos Direitos Humanos. Em 18 de novembro de
2011 foi sancionada a lei federal brasileira nmero 12.527 conhecida como Lei de
Acesso Informao (LAI)142. Para o pesquisador Marcos de Jesus Bonfim (2014), da
Universidade de So Paulo, ela se configura como um marco jurdico e institucional

142
http://www.acessoainformacao.gov.br/assuntos/conheca-seu-direito/a-lei-de-acesso-a-informacao

89

Captulo II

que renova princpios da Administrao Pblica para uma cultura de transparncia do


setor pblico com a sociedade civil. Esta lei visa permitir a qualquer cidado
brasileiro consultar rgos pblicos sobre informaes e dados de seu interesse.
Como complementa a pesquisadora Maringela Furlan Haswani (2006), tambm da
Universidade de So Paulo, h demandas internas e externas de trabalhos que
envolvem grande nmeros de dados.

A demanda existe: no ambiente externo, parte substancial do contedo


informativo dos meios de comunicao de massa ocupada com
assuntos que envolvem os rgos pblicos estatais. Poltica, economia,
transportes, educao, segurana pblica, entre outros, vem sendo temas
prediletos da mdia, variando sua nfase conforme o perfil de cada
audincia. No ambiente interno, as informaes se perdem nos meandros
da burocracia, no circulam entre funcionrios que, nos balces e nos
terminais telefnicos, no sabem o que dizer aos cidados. (HASWANI,
2006, p. 27).

A partir da Lei de Acesso Informao foi institudo o Portal Brasileiro de Dados


Abertos143, uma ferramenta disponibilizada pelo governo para que qualquer pessoa
possa encontrar dados e informaes pblicas. O portal tem o objetivo de divulgar
todo e qualquer dado e funciona como um catlogo que facilita a busca e o uso de
dados publicados pelos rgos do governo. O plano estratgico do governo federal
prev que em poucos anos o portal tenha dados dos rgos federais e das esferas
144
estaduais e municipais . Em 2007, especialistas em dados abertos da
145
OpenDataGov estabeleceram oito princpios que definem os dados abertos
governamentais146. So eles:

1. Completos: Todos os dados pblicos esto disponveis. Dado pblico o dado que
no est sujeito a limitaes vlidas de privacidade, segurana ou controle de acesso.
2. Primrios: Os dados so apresentados tais como coletados na fonte, com o maior
nvel possvel de granularidade e sem agregao ou modificao.
3. Atuais: Os dados so disponibilizados to rapidamente quanto necessrio
preservao do seu valor.


143
Disponvel em: http://dados.gov.br
144
Informao obtida na pgina do portal, em http://dados.gov.br. Acesso em 7 de maio de 2016.
145
Disponvel em: https://opengovdata.org/. Acesso em 25 de novembro de 2015.
146
Pode-se dizer ainda que dados abertos governamentais so dados que so disponibilizados na WEB pelo governo em formato
aberto. Entende-se formato aberto como formato que pode ser manipulado e lido por mquina; so considerados formatos
abertos: txt; xml; csv. Disponvel em: http://www.cps.sp.gov.br/pos-graduacao/workshop-de-pos-graduacao-e-pesquisa/008-
workshop-2013/trabalhos/gestao_estrategica_de_tecnologia_da_informacao/121301_622_633_FINAL.pdf. Acesso em: 8 de
maro de 2015.

90

Captulo II

4. Acessveis: Os dados so disponibilizados para o maior alcance possvel de


usurios e para o maior conjunto possvel de finalidades.
5. Compreensveis por mquinas: Os dados so razoavelmente estruturados de modo a
possibilitar processamento automatizado.
6. No discriminatrios: Os dados so disponveis para todos, sem exigncia de
requerimento ou cadastro.
7. No proprietrios: Os dados so disponveis em formato sobre o qual nenhuma
entidade detenha controle exclusivo.
8. Livres de licenas: Os dados no esto sujeitos a nenhuma restrio de direito
autoral, patente, propriedade intelectual ou segredo industrial. Restries sensatas
relacionadas privacidade, segurana e privilgios de acesso so permitidas.

Temos portanto um grande volume de informaes, que tende a ser cada vez mais
acessvel. Este um ponto da rede, mas como j abordado neste captulo, toda e
qualquer ao no ambiente digital deixa rastros e passvel de ser coletada. O rpido
crescimento das redes sociais digitais e os avanos da tecnologia vm permitindo o
processamento em tempo real de uma grande quantidade de dados. So muitos os
usos e finalidades de estar inserido no ambiente digital, seja por trabalho, por estudo
ou por relaes pessoais.

Liberdade e privacidade na rede


H diversos aspectos a serem abordados ao falar sobre liberdade e privacidade na


rede. As discusses esto em andamento, as regulamentaes em definio e estas so
tendncias mundiais. Abordaremos, de forma breve, algumas das temticas que
devem ser levadas em considerao para contextualizar e situar o cenrio de dados
brasileiros, no qual o jornalismo de dados est inserido. So questes que envolvem
usabilidade, acessibilidade a rede e que impactam na presena da visualizao de
dados no jornalismo.

A vida nas redes da web de exposio, muitas vezes ilimitada em relao a


intimidade. O que realmente privado na web? As pessoas esto aprendendo, na
prtica, o que deve ou no ser mostrado de cada um e como lidam com a exposio ou

91

Captulo II

melhor, com a super-exposio, com as questes de intimidade e gerenciamentos de


crises pessoais em grande escala.

(...) o cyberespace (...) potencializou (...) as possibilidades de insero de


vozes diferentes no contexto pblico. Pessoas comuns, longe da misso
de trabalho e a ttulo de livre expresso do pensamento, providas ou no
de interesses inconfessos, pem-se em contexto pblico, sob o usufruto
da democracia como valor universal, aparentemente sem qualquer
preocupao com a natureza privada ou pblica dessa atuao.
(TRIVINHO, 2014, p. 238).

Paralelamente a esta vivncia e experincia coletiva que envolve o frum ntimo e


privado, h outras vertentes da questo. Elas dizem respeito ao controle, superviso e
acesso s informaes trafegadas na web. As justificativas para as aes de controle e
superviso giram em torno da segurana e das reservas de mercado. Em prol de
combater os males de determinadas prticas na Internet, entre eles o terrorismo e as
redes de pedofilia, so buscadas por diversas lideranas a aprovao de projetos de
controle dos contedos e da navegao na Internet (AMADEU, 2012, p. 61). Esta
superviso e controle de dados tambm contestada por setores econmicos da
sociedade, como por exemplo, as indstrias de intermediao afetadas pela expanso
e proliferao de contedos na web (indstrias fonogrfica, cinematogrfica e
editorial, os radiodifusores e as companhias de telecom ligados muitas vezes a
manuteno dos sistemas de propriedade intelectual).

Em uma apresentao realizada em agosto de 2014147, o pesquisador brasileiro e


doutor em poltica Srgio Amadeu levantou questes importantes sobre a liberdade e
a privacidade na Internet. Para ele, a Internet uma rede ciberntica, simultaneamente
de comunicao e controle, onde a liberdade de expresso depende da existncia da
neutralidade de rede, da inexistncia de censura prvia e do anonimato na navegao.
Para ele, na comunicao em redes digitais, quem controla a infraestrutura pode
controlar os fluxos de informao, uma vez que as arquiteturas de rede so arranjos de
cdigos, definies sobre como proceder para realizar a comunicao entre
computadores. Desta forma possvel limitar e/ou facilitar processos de
comunicao, assim como bloquear aes e contedos. Para Amadeu, a liberdade de
expresso na Internet bem maior do que a liberdade no Facebook, por exemplo, que


147
https://samadeu.files.wordpress.com/2010/03/01_apresentacao_sergioamadeu_egibr.pdf

92

Captulo II

no est limitada somente pelas definies declaradas em documentos de polticas de


uso de dados.

O modo como a Internet foi construda beneficia a diversidade cultural. A arquitetura


da rede distribuda, no existindo centros obrigatrios de trfego dos fluxos de
informao. Ela reconfigurada constantemente pelos usurios, fruto de uma
construo tecnolgica aberta. At o momento, enquanto prevalecer o princpio da
neutralidade da rede, no necessrio se subordinar a determinados formatos ou
aceitar contedos e doutrinas especficos para participar da Internet (AMADEU,
2012, p. 63).

A definio de como ser a Internet em um futuro prximo depender do


resultado do embate atual a respeito do princpio da neutralidade da rede.
Para compreender bem a dimenso deste contencioso que envolve usurios
e pioneiros da Internet, de um lado, contra as operadoras de
telecomunicaes e a indstria de copyright, de outro, importante
observar como a rede mundial de computadores se estrutura e como ela
tem funcionado at hoje (AMADEU, 2012, p. 63).

O princpio da neutralidade da Internet se d pelo seu carter diante da independncia


das camadas da rede. A Internet se configura como uma rede de redes. Estas camadas
so interligadas, mas completamente independentes umas das outras. As camadas
fsicas possuem protocolos que permitem que os bits sejam transformados em sinais
eltricos que so enviados pelas redes fsicas controladas pelas operadoras de
telecomunicaes. J as camadas lgicas se constituem como de enlace, de rede, de
transporte e de aplicao (AMADEU, 2012). Como todo o desenvolvimento da
arquitetura da Internet foi pensado para que a inteligncia da rede e o gerenciamento
humano das aplicaes estivessem nas mos dos usurios finais e no sob o
controle dos intermedirios, o princpio da neutralidade da rede tambm assegura um
outro princpio denominado end-to-end, onde quem deve definir o que deve ser
comunicado so as pontas comunicantes da rede e no os meios que esto entre eles.
(AMADEU, 2012, 72).

A independncia de uma camada diante da outra assegura o dinamismo da


rede. Para se criar uma nova aplicao, no necessrio obter autorizao
de controladores de quaisquer outras camadas, nem de rgos pblicos,
nem de empresas privadas. Por isso, a criatividade to intensa na
Internet. Qualquer um pode criar novos contedos, novos formatos e novas
tecnologias. Novos protocolos de comunicao tambm podem ser criados
e obter um enorme sucesso. Para tal eles devem interagir com os demais

93

Captulo II

protocolos essenciais das outras camadas. At agora, a neutralidade de uma


camada diante da outra tem sido um dos principais fatores que garantem a
cultura de liberdade na rede. (AMADEU, 2012, p. 71).

No Brasil a Lei 12.965/14 148 , conhecida como o Marco Civil da Internet, foi
sancionada pela presidente Dilma Rousseff no dia 23 de abril de 2014, entrando em
vigor em junho do mesmo ano. A lei regulamenta o uso da Internet no pas por meio
da previso de princpios, garantias, direitos e deveres do uso da rede, assim como as
diretrizes para a atuao do Estado. O texto estabelece que o Comit Gestor da
Internet (CGI) 149 o responsvel por determinar as diretrizes. As regras que
regulamentam a lei foram elaboradas por meio de quatro consultas pblicas
elaboradas pela Agncia Nacional de Telecomunicaes, CGI e Ministrio da Justia.
A ideia do projeto de lei do Marco Civil surgiu em 2007 em funo da resistncia
social ao projeto de lei de cibercimes conhecido como Lei Azeredo, muito criticado
por ser um AI-5150 digital.

O Marco Civil da Internet um projeto de lei que visa a consolidar


direitos, deveres e princpios para a utilizao e o desenvolvimento da
Internet no Brasil. A iniciativa partiu da percepo de que o processo de
expanso do uso da Internet por empresas, governos, organizaes da
sociedade civil e por um crescente nmero de pessoas colocou novas
questes e desafios relativos proteo dos direitos civis e polticos dos
cidados. Nesse contexto, era crucial o estabelecimento de condies
mnimas e essenciais no s para que o futuro da Internet seguisse baseado
em seu uso livre e aberto, mas que permitissem tambm a inovao
contnua, o desenvolvimento econmico e poltico e a emergncia de uma
sociedade culturalmente vibrante (CGI, 2015)151

No artigo trs152 a lei garante a liberdade de expresso, comunicao e manifestaes


do pensamento, proteo dos dados pessoais, na forma da lei, preservao e garantia
da neutralidade de rede. O artigo 10 define que a guarda e a disponibilizao dos

148
Disponvel em: http://www.planalto.gov.br/CCIVIL_03/_Ato2011-2014/2014/Lei/L12965.htm. Acesso em 22 de janeiro de
2014.
149
http://www.cgi.br/
150
Ato institucional do regime militar que esteve em vigor de 1968 a 1978 e que dava poderes extraordinrios ao presidente da
repblica e suspendia vrias garantias constitucionais.
151
Disponvel em: http://www.cgi.br/publicacao/o-cgi-br-e-o-marco-civil-da-internet/.
152
De acordo com o artigo 3o, da lei Marco Civil brasileiro, a disciplina do uso da Internet no Brasil tem os seguintes princpios:
I - garantia da liberdade de expresso, comunicao e manifestao de pensamento, nos termos da Constituio Federal;
II - proteo da privacidade;
III - proteo dos dados pessoais, na forma da lei;
IV - preservao e garantia da neutralidade de rede;
V - preservao da estabilidade, segurana e funcionalidade da rede, por meio de medidas tcnicas compatveis com os padres
internacionais e pelo estmulo ao uso de boas prticas;
VI - responsabilizao dos agentes de acordo com suas atividades, nos termos da lei;
VII - preservao da natureza participativa da rede;
VIII - liberdade dos modelos de negcios promovidos na Internet, desde que no conflitem com os demais princpios
estabelecidos nesta Lei.

94

Captulo II

registros de conexo, de acesso, assim como dados pessoais devem atender


preservao da intimidade. No artigo 7, a lei determina que o provedor responsvel
pela guarda somente disponibilizar os registros que possam contribuir para a
identificao do usurio ou do terminal, mediante ordem judicial.

Neste perodo de definies e usabilidades desta nova ambincia, h diferentes


interpretaes de situaes corridas no ambiente digital e inmeras contestaes
diante das regulamentaes que aparecem no cenrio nacional e internacional. Por
exemplo, empresas como Apple, Google e Facebook, assim como organizaes no-
governamentais solicitaram ao Congresso dos Estados Unidos regras mais claras e
maior transparncia sobre pedidos de informao em que as autoridades invoquem
razes de segurana. Estas empresas procuraram tranquilizar os usurios aps as
denncias feitas pelo analista informtico Edward Snowden de que os servios de
segurana e espionagem dos Estados Unidos tem acesso a informaes particulares.
No Brasil, at maio de 2016, por duas vezes o aplicativo de mensagem instantnea
WhatsApp foi bloqueado por determinao judicial. No dia 2 de maio de 2016, por
exemplo, a justia do Estado de Sergipe determinou que as operadores de telefonia do
pas bloqueassem o acesso de todos os brasileiros ao aplicativo por um prazo de 72
horas porque o Facebook, dono do WhatsApp, no cumpriu uma deciso judicial anterior
de compartilhar informaes que subsidiariam uma investigao criminal. No dia seguinte,
dia 3 de maio, o WhatsApp conseguiu uma deciso favorvel da Justia e o servio passou
a ser restabelecido assim que as operadoras foram notificadas e fizeram ajustes em sua
rede de telefonia.

O cenrio complexo, est em andamento e contnua transformao. H discusses


sobre o limite de dados da Internet, por exemplo, onde as operadoras que atuam no
Brasil querem oferecer planos de internet fixa (usada nas residncias e empresas) com
limite de download. Onde o servio pode ser suspenso quando o usurio atingir uma
determinada quantidade de arquivos e dados baixados153. As discusses acontecem em
diversos mbitos, seja o acadmico, o jurdico, o poltico, entre outros. Fato que a
vivncia digital est inserida no cotidiano, governos em todo o mundo tendem a
aumentar a transparncia disponibilizando cada vez mais dados referentes

153
A Mentira Por Trs do Limite da Internet Marcelo Toledo -
https://www.facebook.com/MarceloToledoDONO/videos/1209510815733649/?pnref=story.

95

Captulo II

administrao pblica. A produo de contedos jornalsticos e sees em sites


especificamente para disponibilizar dados produzidos, organizados e estruturados por
jornalistas atravs de APIs uma realidade. Cenrio que para ns confirma a
expanso e relevncia do jornalismo de dados e das visualizaes de dados no
jornalismo digital. Como fazer jornalismo de dados, com visualizaes de dados,
arquivos leves, responsivos diante de um cenrio de acesso limitado de banda larga,
acessos crescentes a Internet por aparelhos mveis, tendncias de feeds154 de notcia
so, entre inmeras outras variveis, desafios que permanecem para o jornalismo
contemporneo, sem frmulas mgicas ou consolidadas de sucessos reproduzveis.

Consideraes

O mapa da clera em Londres, desenvolvido pelo mdico Jonh Snow, em 1854, foi
um marco de como uma infografia baseada em dados contribuiu para a compreenso
de um fenmeno da poca. A partir da cincia por trs dos dados e da forma de
apresentao da informao foi possvel compreender o meio transmissor da doena
que tinha levado tantas pessoas morte. Nos dias atuais a visualizao de dados
continua sendo um importante meio de investigao e compreenso de fenmenos.
No entanto, hoje falamos de um volume, variedade e velocidade de dados
humanamente imensurveis. A sociedade est cada vez mais digitalizada, dados em
diferentes extenses so passveis de serem armazenados e correlacionados. Neste
cenrio falamos de um jornalismo de dados. Um jornalismo que visa o entendimento
de temas complexos de relevncia social e que sintoniza o jornalismo com as novas
necessidades de compreenso informativa da sociedade contempornea.

O segundo captulo teve por objetivo exemplificar o jornalismo de dados e a


visualizao para, a partir da sua presena no cotidiano discutir com mais
profundidade as questes tericas que sero trabalhadas no captulo III. Os exemplos
envolveram investigaes e inmeras correlaes de dados que foram apresentadas
aos leitores de maneiras distintas como em infogrficos e mapas, tendo como foco o


154
um formato de dados usado em formas de comunicao com contedo atualizado frequentemente, como sites de notcias
ou blogs. Distribuidores de informao, blogueiros ou canais de notcias disponibilizam um feed ao qual usurios podem se
inscrever, no formato de um link. Outros formatos de dado possveis de serem comunicados por feeds so arquivos de
udio, podcasts e vdeos. Disponvel em: https://pt.wikipedia.org/wiki/Feed. Acesso em 5 de maio de 2016.

96

Captulo II

cenrio brasileiro. Distinguimos em trs principais reas como as visualizaes de


dados vem aparecendo no pas: nos veculos tradicionais de mdia, nas iniciativas
independentes e nos laboratrios acadmicos. Por isso, trouxemos exemplos que
foram coletados ao longo dos primeiros 15 meses de observao da prtica em mbito
nacional. De imediato percebemos que a formao das equipes, as fontes dos dados e
o tempo de produo dos contedos so distintos de outras prticas jornalsticas,
frutos de um sistema narrativo que na contemporaneidade adquire novas rotinas
produtivas. As equipes so formadas por profissionais de competncias distintas,
principalmente jornalistas, programadores, designers, estatsticos. As fontes envolvem
bases de dados, muitas originrias de servios pblicos, mas tambm no so
descartadas entrevistas e outros recursos j tradicionais prtica jornalstica como
meio de construo das peas. Por conta do aprofundamento dos temas, do manuseio
com os dados e das apresentaes dos contedos (seja para a interpretao dos
prprios reprteres ou para o pblico/leitor), so trabalhos que podem demorar de
poucas horas h meses.

Em um segundo momento a preocupao foi pontuar as discusses polticas e leis de


transparncia que interferem na produo e disseminao da usabilidade na web e
consequentemente da prtica do jornalismo de dados no pas. O contexto nacional
visa o estabelecimento de condies mnimas para um uso da Internet de forma livre e
aberta, permitindo inovaes, desenvolvimento econmico e poltico, mas no deixa
de ser um cenrio que est em andamento e contnua transformao. H tenses sobre
o controle de trfego de dados, privacidade na rede, fatores constantes de discusso,
consultas pblicas, que envolvem diretamente o estudo desta pesquisa. Ter acesso
limitado a download, por exemplo, pode fazer com que leitores optem por no baixar
contedos jornalsticos mais pesados, no consultar bases de dados, implicaes que
podem vir a interferir em um modo de fazer jornalismo que possui relevncia social,
mas que tambm precisa ser consumido, ser apropriado pelos leitores. Quais
caminhos ento devero ser tomados? H meios de oferecer servios mais compactos?
Que posicionamentos devem ser tomados a partir das decises polticas e econmicas
nacionais que envolvem o uso de dados, as fontes dos dados? Estar atento ao cenrio
diz respeito ao jornalismo de dados. No prximo captulo o desafio situar a
visualizao de dados dentro do sistema narrativo contemporneo.

97

Captulo III

III. O FAZER JORNALISMO DE DADOS E A VISUALIZAO NO


SISTEMA NARRATIVO

Resumo: Neste captulo nos aprofundaremos nas visualizaes em base de dados


apontando em que momento esta prtica se encontra dentro da produo jornalstica.
Para tanto, temos a tarefa de abordar conceitos de narrativa como sistema, formato e
design no jornalismo. Por fim, apontaremos as questes de credibilidade e valor
jornalstico diante do cenrio cultural contemporneo.


Palavras-chave: sistema narrativo, formato, visualizao de dados, designer, valor
jornalstico

O futuro j chegou, s no est uniformemente distribudo. (Willian


Ford Gibson, 1999)155

Diferentes olhares e novas prticas




Em 2012, os pesquisadores Chris Anderson, Emily Bell e Clay Shirky lanaram o
relatrio Jornalismo Ps-Industrial - adaptao aos novos tempos, pelo Tow Center
for Digital Journalism da Columbia Journalism School156. O trabalho abordou o atual
estgio do jornalismo, as condies tcnicas, materiais e os mtodos empregados na
apurao e divulgao das notcias at o fim do sculo 20 e que j no se aplicam nos
dias atuais. Estamos em meio a uma revoluo, e a adaptao s novas fronteiras da
profisso a condio de sobrevivncia nesse cenrio, que prev o uso intensivo de
base de dados, alm da interao com mltiplas fontes e com o pblico
(ANDERSON et al., 2012, p. 30). O relatrio partiu de cinco grandes convices: a) o
jornalismo essencial; b) o bom jornalismo sempre foi subsidiado; c) a Internet acaba
com o subsdio da publicidade; d) a reestruturao se faz, portanto, obrigatria; e) h


155
Willian Gibson cunhou o termo cyberpunk e autor da obra Neuromancer (1984). Citou a frase no dia 30 de novembro de
1999, em entrevista a NPR Interview.
156
A revista ESPM publicou o artigo Jornalismo ps-ndustrial adaptao aos novos tempos. So 60 pginas (sem gravuras)
divididas em trs partes com o estudo preparado pela Columbia University sobre como a imprensa pode prosperar para alm do
mercado em crise. Disponvel em:
http://www.espm.br/download/2012_revista_jornalismo/Revista_de_Jornalismo_ESPM_5/files/assets/common/downloads/REVI
STA_5.pdf.

98

Captulo III

muitas oportunidades de fazer um bom trabalho de novas maneiras. Neste captulo,


em um primeiro momento, vamos nos ater a duas dessas premissas: o jornalismo
essencial e h muitas oportunidades de fazer um bom trabalho de novas maneiras. A
partir do que o jornalismo significa enquanto essncia possvel discutir as suas
tcnicas. Aqui optamos por trabalhar com o lado srio do jornalismo, o que pode ser
chamado por hard news ou accountability journalism 157 ; coberturas de fatos
importantes e reais que impactam e podem mudar rumos sociais.

O jornalismo expe a corrupo, chama a ateno para a injustia, cobra


polticos e empresas por promessas e obrigaes assumidas. Informa
cidados e consumidores, ajuda a organizar a opinio pblica, explica
temas complexos e esclarece divergncias fundamentais. O jornalismo
exerce um papel insubstituvel tanto em regimes democrticos como em
economias de mercado. (ANDERSON et al., 2012, p. 33).

Para ns o jornalista no somente um narrador de fatos, ele o responsvel por


coletar, apurar, interpretar e contextualizar fatos. Diante do cenrio tecnolgico pode
recorrer a grficos interativos, solicitar imagens e informao ao pblico/leitor,
disponibilizar acesso direto a bancos de dados e distribuir matria por redes sociais.
O aspecto mais animador e transformador do atual cenrio jornalstico poder
explorar novas formas de colaborao, novas ferramentas de anlise e fontes de dados
e novas maneiras de comunicar o que de interesse do pblico (ANDERSON et al.,
2012, p. 38). O jornalista no foi substitudo e nem ser extinto. O profissional foi
deslocado para um ponto acima na cadeia editorial exercendo a funo de verificar,
interpretar e dar sentido enxurrada de texto, udio, fotos e vdeos inseridos na web,
tornou-se um curador, algum capaz de fazer a filtragem, a reorganizao e a
interpretao do que se procura e encontrado na Internet (BEIGUELMAN, 2016)158.
Num ambiente em que a informao base para a produo do saber e conta com a
presena de algoritmos para a verificao de padres coletados a partir de metadados,
que registram, por exemplo, os rastros dos indivduos na web. Os algoritmos, diante
do volume de dados com que lidamos, permitem que operemos a dadosfera.
(BEIGUELMAN, 2016)159. No entanto, o que ainda se observa na prtica cotidiana,


157
Traduzindo ao p da letra: notcias duras e jornalismo de prestao de contas, respectivamente.
158
O termo foi amplamente discutido no ebook Curadoria Digital e o campo da Comunicao. Disponvel para download em
http://grupo-ecausp.com/novo-ebook-curadoria-digital-e-o-campo-da-comunicacao/
159
Disponvel em: http://noticias.uol.com.br/opiniao/coluna/2016/02/21/curadoria-de-conteudo-e-o-lugar-do-humano-na-
internet.htm. Acesso em 21 de fevereiro de 2016.

99

Captulo III

que diversos profissionais e instituies jornalsticas no tem tirado proveito da


exploso de contedo potencialmente relevante da comunicao digital.

Devia haver mais trabalho de reportagem, e no menos, e essa reportagem


devia aprender a conviver com formas mais recentes de apurao de
informaes de interesse jornalstico. Reconhecemos que o colapso
econmico de jornais representa uma ameaa bastante real para o trabalho
de reportagem; a soluo desse dilema exigir uma nova ateno a
instituies jornalsticas (...).(ANDERSON et al., 2012, p. 43).

Estamos em processos de mudana, adaptao, inovaes que possuem o uso


intensivo de base de dados, interao com mltiplas fontes e com o
pblico/leitor/usurio. Transformar dados em informao e a informao em
conhecimento depende de expertises, de anlises, interpretaes. Novas possibilidades
para o jornalismo exigem novas formas de organizao e somente incorporar tcnicas
no sero suficientes para a adaptao ao novo ecossistema. Em 2011 a professora
Elizabeth Saad j fazia o alerta para as empresas sobre a necessidade de reaprender a
construir e a disponibilizar o contexto, a sair da fragmentao noticiosa e rumar para
uma conduo da audincia na busca de mais e mais informaes correlacionadas.
(SAAD, 2011, p. 61). Isso em um cenrio onde os exploradores de dados, criadores
de visualizao de informao possuem um conjunto maior de ferramentas. preciso
que os jornalistas, nas suas mais diferentes funes (reprteres, editores, diretores)
tenham um olhar para o backend160 e para o frontend161 jornalsticos.

Concordamos com a pesquisadora Daniela Bertocchi que as bases de dados so


essenciais, mas no esto no centro do sistema narrativo, uma vez que devem ser
considerados os algoritmos, os sistemas publicadores, os metadados e todas as
demais camadas que se apresentam no momento de antenarrao so
fundamentalmente centrais formatao da narrativa (BERTOCCHI, 2013, p. 211).
Desta forma, a formatao o fruto da base de dados e tambm o resultado do sistema
capaz de revelar comportamento de todo um sistema (ibidem, 2013, p. 211).
Vivenciamos um processo de inovao e absoro de tecnologias nunca
experimentados, conduzidos por pessoas de fora da rea, com outras expertises; que
transmitem informao relevante. Onde se encontra a visualizao de dados neste

160
Interface digital administrativa acessvel por administradores do sistema (BERTOCCHI, 2014, p.18);
161
Interface digital acessvel por usurios finais (BERTOCCHI, 2014, p.18)

100

Captulo III

cenrio e no sistema narrativo? Como apresentar os dados para o pblico de maneira


inovadora?

Para a pesquisadora Martha Gabriel (2012, anotaes)162 especialista em marketing


digital, inventar criar, engendrar, descobrir. J inovar tornar novo, renovar,
introduzir novidade em alguma coisa. A inveno tende a ser uma ruptura. A
inovao tem como virtude adaptar, substituir, combinar, ampliar ou reduzir, enfim,
so outras utilizaes. Para a pesquisadora Elizabeth Saad (2014)163 inovamos por
motivos macros e micros. Macros diante do desperdcio de recursos que poderiam ser
aproveitados em novos usos, em melhorias em produtos que poderiam ser aplicados
em outras funes ou utilidades, em necessidades culturais latentes ou emergentes.
Inovamos por motivos micros por novos desenvolvimentos como varivel
competitiva, liderana, lucratividade, sobrevida ou reconfigurao de uma marca. A
inovao no uma inveno; ela tem a ver com a criatividade, com solues,
melhorias, criao de novos produtos e usos. No cenrio contemporneo as inovaes
acontecem nas tecnologias, nas mdias, no jornalismo, nos usurios, na sociedade.
Para acontecer depende da cultura e economia da indstria, do processo de gesto da
inovao e de pessoas.

O uso de bases de dados reconfigura, pelo vis do cruzamento de dados, um contedo


mais original ao jornalismo, onde os dados podem ser somados, comparados,
integrados entre si. O jornalista, por sua vez, reordena, filtra, segmenta identifica
padres na informao, revela tendncias, expe resultados. Pode participar tanto
como produtor do contedo como participar do desenvolvimento de softwares. A
prtica do jornalismo digital se d a partir do agenciamento coletivo de diferentes
atores como jornalistas, designers, engenheiros, programadores, arquitetos de
informao, especialistas em negcios, usurios, algoritmos, robs, softwares, entre
outros. No ecossistema comunicacional, o jornalista assume o processo de
humanizao dos dados servindo como um investigador, algum que traduz e conta
fatos. Precisa pensar sobre o tipo de experincia narrativa que os usurios podero
atingir ao entrar em contato com as histrias no mundo digital, por diferentes


162
Mdulo de Marketing Digital realizado no primeiro semestre de 2012, no Curso de Gesto Integrada da Comunicao Digital
nas Empresas (Digicorp), na Escola de Comunicaes e Artes da Universidade de So Paulo.
163
Mdulo de Tecnologia e Inovao, do Curso de Gesto Integrada da Comunicao Digital nas Empresas (Digicorp), na Escola
de Comunicaes e Artes da Universidade de So Paulo, 2014. Participao como ouvinte.

101

Captulo III

dispositivos, e que tipo de reao o sistema narrativo tende a provocar seja em qual
tela estiver. Os formatos mais ricos so aqueles que compreendem de antemo a
narrativa como um processo constante de dados, metadados e formatos mltiplos
(BERTOCCHI, 2013, p. 215). E como aponta a pesquisadora Daniela Bertocchi,
exatamente no backend jornalstico que ocorrem os agenciamentos das camadas do
sistema narrativo. Momento este que possivelmente os usurios finais do produto no
tero acesso.

Princpios da narrativa contempornea

Ao mencionar a importncia de narrativas originais e criativas que unem recursos


como udio, vdeo e texto no-lineares, fala-se em hipermdia. Na viso do professor
Srgio Bairon, da Escola de Comunicaes e Artes da Universidade de So Paulo, a
hipermdia pode ser entendida como a expresso no linear da linguagem, que atua
de forma multimiditica e tem sua origem conceitual no jogo (BAIRON, 2011, p 7).
uma expressividade da linguagem e no o resultado de uma evoluo tecnolgica.
Em nvel tcnico, sua atuao multimiditica significa que, no mesmo ambiente,
temos imagens (fixas ou em movimento), textos e sons que sustentam o contedo
exposto (ibidem, 2011, p. 8). A hipermdia um conceito terico e filosoficamente
complexo, onde preciso ter em mente que as potencialidades so tecnolgicas, mas
as condies de criao e produo so conceituais. Desafia os paradigmas da
Comunicao e da compreenso tradicional no interior da produo de conhecimento
e, neste sentido, torna-se fundamental entender o que est alm do advento das novas
tecnologias; de uma hipermdia no apenas como um aparato, mas sim como um novo
meio promotor de conhecimento no qual o jornalismo digital se apropria. Um
jornalismo que utiliza narrativas inovadoras, base de dados, imerso, geolocalizadores
entre muitos outros recursos disponveis.

A comunicao em rede acelerou todo o processo de transmisso de informao.


Quando transformou o texto impresso em cdigo eletrnico mudou a forma de
manipulao e o compartilhamento de dados, possibilitando a construo e habitao
de um mundo que proporciona tanto a demonstrao de contextos cotidianos quanto a
experincia associada a um conceito.
102

Captulo III

Cada nova mquina tecnosocial contribui com novos dimensionamentos


espaciais e temporais que apontam para a multiplicao contempornea
dos espaos, seja como razo primordial do nosso nomadismo estilstico,
seja como, multiplicao da necessidade de buscas (BAIRON, 2011, p.
82).

A imerso uma condio de habitao, revelada pela experincia da construo da


relao de sentido entre ambientes e usurios, onde o mais importante na forma de
observar o cotidiano no a descrio dos produtos culturais, mas sim as diversas
maneiras que tem os usurios de utilizao desses produtos. (...) dentro do mundo
das experincias estticas, imagens, sons e textos passaram a compor e impor-se, no
mundo hipermdia, como elementos conjuntos e cooperativos da produo de sentido
e significncia reticular. (BAIRON, 2011, p. 87). Desde a inveno da prensa, a
tecnologia da informao ocupou-se de criar e propagar informaes em um formato
esttico, o que permitia que o conhecimento transmitido antes oralmente pudesse
agora ser repassado a diferentes leitores em locais e tempos distintos (BARIANI &
BAIRON, 2012). No sculo XIX, a prensa de alta velocidade teve um papel
democratizante ao criar e distribuir mltiplas cpias de texto ao invs de restring-lo,
como acontecia na poca do manuscrito. Em contrapartida, de acordo o pesquisador
George Landow (2009), autor do livro Hipertexto 3.0, tal organizao hierrquica e
linear, tpica do texto impresso nem sempre coincide com as necessidades individuais
de cada leitor. Para tanto foram inventados os captulos, nmeros de pginas etc.,
como forma de melhor direcionar o indivduo de acordo com seus prprios interesses.
A ltima e grande mudana da tecnologia da informao foi a tecnologia digital.

A hipermdia vai de encontro dicotomia entre arte, religio e cotidiano e a


interpretao. Dicotomias iniciadas no Iluminismo (sculo XVIII) que definiram a
linguagem escrita como a de maior credibilidade em detrimento de outras linguagens
e formas de apreenso de conhecimento. Unindo diferentes extenses, a hipermdia
traz exatamente na interseco do objetivo e do subjetivo a busca da verdade e do
conhecimento.

(...) o primeiro grande poder definidor da hipermdia est na hibridizao


das matrizes de linguagem e pensamento, nos processos sgnicos, cdigos
e mdias que ela aciona e, consequentemente, na mistura de sentidos
receptores, na sensorialidade global, sinestesia reverberante que ela
capaz de produzir, na medida mesma em que o receptor ou leitor imersivo
interage com ela, cooperando na sua realizao. Por isso mesmo, em uma

103

Captulo III

definio sucinta e precisa, hipermdia significa a interao sem suturas


de dados, textos, imagens de todas as espcies e sons dentro de um nico
ambiente de informao digital. (FELDMAN, 1995, p. 4).

Para o terico russo Lev Manovich (2002), o caminho de estrutura de uma narrativa
imbrica a experincia do homem com as tecnologias disponveis. No entanto, ele
defende que aliado aos dados computadorizados, a sntese numrica em que as
imagens so transformadas devem ser desenvolvidas com esttica e elementos
poticos no banco de dados. Manovich aprofunda esta ideia no projeto Soft
Cinemas164, onde une trabalhos artsticos de composio das cenas, influncias da
cultura popular, do filme e da arte. Neste projeto o banco de dados est disponvel em
diversos locais, como em CD-ROM, DVD, fotografias, possibilitando inmeras
reconstrues narrativas executadas pelo software do computador em edio
instantnea. Os dados podem ser acessados cronologicamente, por pas, artista,
possibilitando uma navegao por diferentes caminhos. A tecnologia digital
possibilita explorar diversos formatos em narrativas que interagem com o usurio.
No necessariamente a histria est ali contada, nos casos da hipermdia podem no
ter incio ou fim, ter o desenvolvimento temtico organizado ou no em sequncia, a
experincia do usurio com colees computadorizadas um pouco distinta da leitura
de uma narrativa ou de assistir um filme ou navegar na arquitetura de um site
(MANOVICH, 2002, p. 219). Concordando com a pesquisadora Daniela Ramos
(2011), selecionar e combinar bases de dados em formatos digitais, de modo a gerar
narrativas um desafio.

Entendemos, como Manovich (1999, 2006) e Jenkins (2008), que novas


formas narrativas no so como as formas clssicas, com trama, enredo e
fbula, comeo, meio e fim, conectando personagens e situaes. Como
coloca o primeiro autor, escolher um produto cultural na base de dados do
consumo , de certa forma, contar algo sobre ns mesmos. Para que
consigamos contar algo sobre qualquer coisa, precisamos de linguagens e
estas, hoje, so selecionadas a partir das bases de dados (RAMOS, 2011, p.
06).

Neste sentido, das linguagens selecionadas por dados, Manovich entende que as
caractersticas da forma cultural base de dados so (MANOVICH, 2006, p. 63-103):


164
Disponvel em: http://www.softcinema.net/index.htm?reload.

104

Captulo III

1o) Representao numrica a representao numrica tem em sua essncia


nmeros, convertidos em cdigo binrio, onde so manipulados e capazes de gerar
contedos com sentido;

2o) Automao os dados so passveis de serem programveis e terem modificao


de forma automtica, via algoritmos;

3o) Modularidade os dados so modulares uma vez que a mdia mantm a mesma
estrutura em diferentes escalas;

4o) Variabilidade passvel de ser disponibilizado em distintas verses;

5o) Transcodificvel contedo passvel de ser traduzido para outro formato, de


modo programvel, sendo codificado atravs de outros cdigos que no so o da sua
origem.

Ampliando as perspectivas tericas, como forma de contextualizao, o autor Henry


Jenkins (2009) defende que cada vez mais as narrativas esto se tornando construes
de universos no explorados ou esgotados em uma nica obra ou mdia, o que ele
denomina como narrativa transmdia. Em suma, a convergncia tecnolgica
possibilita contar histrias de maneiras inovadoras, unindo modalidades de
percepes reais e virtuais tendo a participao do pblico. Usos de tecnologias que
exploram sensaes, sentidos. E neste cenrio tambm esto presentes as narrativas
jornalsticas diferenciadas, os projetos jornalsticos que envolvem apresentao de
uma enorme quantidade de dados. Prtica esta que faz parte do jornalismo de dados e
que neste artigo aprofundar um formato, o de visualizao de dados.


Jornalismo como sistema: seleo de informaes e formato narrativo

O pesquisador Ronaldo Henn (2002), retomando os pensamentos do pesquisador


Edvaldo Pereira Lima (1982)165, defende o jornalismo como um sistema construdo de

165
Em dissertao de mestrado defendida na Escola de Comunicao e Artes, da Universidade de So Paulo, em 1982, sob o
ttulo O jornalismo impresso e a teoria geral dos sistemas: um modelo didtico de abordagem.

105

Captulo III

partes interdependentes, o qual apresenta caractersticas definidoras (a linguagem) e


desempenha uma funo especfica (comunicar relatos de acontecimentos sociais). No
ambiente digital, a narrativa deixa de ser compreendida como texto e imagens
estaticamente diagramados; deixa de ser apreendida como um produto jornalstico
final e passa a ser como um processo dinmico em constante manifestao e
transformao no tempo e espao digitais. (BERTOCCHI, 2013, p. 39). O usurio
experimenta o fluxo contnuo de eventos.

De acordo com Daniela Bertocchi a narrativa como sistema um conjunto


complexo, artificial, no qual atuam distintos atores humanos e no-humanos e que
produz um todo maior que suas partes (BERTOCCHI, 2013, p.50). Ela comea a ser
construda em cima da codificao maqunica e, conforme as camadas de bases de
dados vo dialogando com outras camadas, forma-se um tecido narrativo. Quando a
narrativa chega a uma interface para o usurio, ela j foi formatada, renderizada e o
seu fluxo continua, uma vez que os usurios acrescentam comentrios, compartilham
o texto, links. A narrativa assim manifesta-se a partir da interao entre camadas
computacionais, a strata e revela- se portanto um processo artificial de design
informtico (Ibidem, 2013, p. 55) . A camada mais prxima da superfcie o
formato. Os formatos modelizam as linguagens digitais. Formatos so interfaces para
as bases de dados disponveis no ciberespao (RAMOS, 2011, p. 55).

Daniela Bertocchi props em sua tese doutoral um modelo de sistema narrativo,


explicando em atos o que cada fase representa (BERTOCCHI, 2013, p.70):

Ato I Antenarrao dos dados o levantamento e a seleo das informaes


de interesse pblico guardadas nas bases de dados;

Ato II Antenarrao dos metadados a semantificao destes dados para


compreenso de softwares e algoritmos, para a apresentao de narrativas nas
interfaces digitais e tambm para a organizao interna de dados em sistemas
publicadores;

Ato III Narrao ou formatao narrativa a organizao corporificada da


narrativa na interface digital para acesso dos usurios finais.

106

Captulo III

Figura III. 11 O Sistema Narrativo no Jornalismo Digital (BERTOCCHI, 2013)


Fonte: BERTOCCHI, 2013, p. 70.

A programao de mquinas e a automatizao de processos possibilitam garimpar


com rapidez grandes volumes de dados. Algumas relacionadas a web semntica
(gerao de conhecimento pela mquina) podem fazer pequenas anlises ou at
escrever textos de resultados de jogos apenas atualizando os dados, como o caso
divulgado em 2011, pela empresa Narrative Science166, uma startup de Evanston,
Illinois (EUA), que apresentou computadores imitando o raciocnio humano ao
escrever notcias. O software toma dados como os de estatsticas esportivas, relatrios
financeiros de empresas, lances e vendas de moradias e os transforma em notcias. No
entanto, em todas as outras situaes, inclusive para ensinar a mquina, preciso
fazer a leitura dos dados e interpret-los. Em suma, disponibilidade e acessibilidade
so questes diferentes. Neste contexto, fundamental que os jornalistas
compreendam a natureza do que os conjuntos imensos de dados representam e podem


166
https://www.narrativescience.com/

107

Captulo III

revelar, assim como a importncia de ter uma escrita compatvel com diferentes
formatos.
na camada de antenarrao que ocorrem possivelmente as influncias
mais significativas da inteligncia artificial no sistema narrativo e que,
uma vez agenciadas, tendem tambm a modificar, alterar o sistema
narrativo e seu comportamento. A antenarrao abre vias para se pensar
numa computao social centrada no humano. (BERTOCCHI, 2013, p.
213).

Fazer com que dados de fontes distintas e diferentes extenses dialoguem um


desafio, onde a aproximao da programao com os jornalistas, principalmente na
fase de antenarrao dos dados determinante para o desenvolvimento de todo o
sistema narrativo. Encontrar variveis e correlaes so uma segunda etapa de
trabalho com os dados. Para o avano neste setor so necessrios investimentos em
tecnologia, em softwares e em treinamento para que os jornalistas aprendam a lidar
com os dados. Jornalistas que estejam aptos para a colaborao e para o
desenvolvimento de programas sugerindo novas buscas de contedos e interaes que
podem gerar resultados mais interessantes para os usurios finais. O jornalista deve
ser capaz de analisar dados e indicadores e ter conscincia de que os nmeros
representam atividades humanas (ANDERSON et al., 2012). Quanto mais complexos
os projetos, maior a combinao de diferentes conhecimentos e habilidades, alm de
um sistema de produo planejado e hierarquizado em funes de trabalho, o que
dificilmente poderia ser realizado por apenas um profissional utilizando uma
ferramenta (CAIRO, 2008, p. 84).

cada vez mais comum, por exemplo, a descrio de acontecimentos e


compartilhamento feitos por cidados conectados web, principalmente em situaes
de desastres naturais, acidentes, roubos. Neste sentido, a apurao dos fatos ocupa
um lugar relevante para o trabalho jornalstico de interesse pblico uma vez que
jornalista no um mero narrador de fatos. A antenarrao de metadados de origem
cognitiva e de gerao de sistemas culturais simblicos. A consolidao da prtica da
antenarrativa de metadados contribuir para o desenvolvimento da web semntica e da
esfera semntica (inteligncia coletiva humana); possibilitando pensar em uma
computao social centrada no humano. Onde ferramentas, produtos e inclusive
construes narrativas levem em conta a experincia do usurio, seus gostos e sua
linha de raciocnio. O objetivo ser engajar as pessoas pelo que elas gostam e que
108

Captulo III

possam vir a compartilhar, comentar. So inmeras as possibilidades no meio digital,


mas todas as prticas, sejam de jornalistas, publicitrios ou empresas de mdia
devem engajar o pblico, agregar valor e gerar conhecimento. Devem sempre trazer
algo a mais, disse a professora Dra. Elizabeth Saad, durante o Festival Path 2015,
durante a sua fala sobre as tendncias na comunicao, na qual ressaltou a Digital
Humanities. Na sociedade digitalizada, as atividades de pesquisa das reas das
Cincias Humanas e Sociais esto cada vez mais associadas as ferramentas oferecidas
pela Computao. As metodologias da Histria, Filosofia, Artes, estudos culturais,
por exemplo aparecem associadas a visualizao de dados, recuperao de
informao, minerao de dados e estatstica. O olhar voltado para os dados
aproxima o jornalismo da cincia de dados.

Temos um tambm complexo backend jornalstico que acaba por ser organizado em
formatos, uma vez que no contexto do jornalismo digital, os dados so arquivos de
bits que no processamento de sntese, da juno de vrios processos, tornam-se signos
discretos ou contnuos que geram as semioses (RAMOS, 2012, p.28). Eles no so
informao, mas quando organizados em um formato, geram informao jornalstica.
O formato cumpre a funo de modelizar as linguagens potenciais que o signo
informtico pode gerar (Ibidem, 2012, p. 28). Pensar no formato narrativo digital
significa pensar em como os usurios se apropriam de servios, tecnologias e
dispositivos num contexto digital (SCOLARI, 2010, p.138). O agenciamento coletivo
interestratos so as interligaes que existem entre identificar e compreender em
profundidade os estratos narrativos (BERTOCCHI, 2013). A partir deles possvel
identificar quais ns foram amarrados, o que foi considerado importante para o
sistema e o que eventualmente se revelou irrelevante em seu desenho.

A recolha de fontes, a seleo de informaes e o formato da narrativa


constituem critrios habitualmente ativados ao longo da modelagem
narrativa no-digital e que so igualmente levados ao processo de
modelagem da narrativa digital. No entanto, a consequncia mais evidente
da transposio das rotinas e da prtica jornalstica no momento do
desenho do sistema narrativo que a atuao do jornalista, uma vez
realizada moda tradicional, revela- se insuficiente e limitada porque
incide apenas em uma parte da modelagem narrativa, e no no sistema
como um todo. Diramos que incide muito mais no frontend (interface
final) que no backend (bastidores). (BERTOCCHI, 2013, P. 59)

109

Captulo III

O jornalista no precisa ser multitarefa, mas precisa ter clareza de algumas prticas.
No entanto, como sugere Bertocchi, no momento histrico em que vivemos o
jornalismo deve se abrir para ter contato com o modus operandi dos diversos estratos
do sistema o que lhe daria a vantagem de compreend-lo e tirar deste entendimento
algum proveito comunicacional (BERTOCCHI, 2013, p. 60).

Assume-se que os jornalistas podem compreender sistemas sem precisarem


se tornar matemticos ou programadores, um ponto que j vem sendo
trabalhado pela Universidade de Columbia atravs do curso de mestrado
em Jornalismo e Computao, onde os alunos tm aulas de Introduo s
bases de dados, Inteligncia Artificial, Desenho da Interface do Usurio,
Anlise de Algoritmos e Sistemas de Visualizao de Informao entre
outras disciplinas atualmente ignoradas pelos cursos de Jornalismo
tradicionais (BERTOCCHI, 2013, p. 60).

Para Daniela Osvald Ramos (2012), o profissional do jornalismo poderia atuar na


modelagem da informao, dominando a tcnica dos termos modelizados pelos
formatos; usando as bases de dados, pblicas ou privadas, como centro da criao e
como fonte para reportagens assistidas por computador (RAC); aplicando a
arquitetura de navegao; classificando contedos de forma semntica (tags, palavras-
chave, web semntica), para que as informaes contidas no formato possam ser
recuperadas, tanto pela empresa quanto pelo usurio; buscando a clareza do que se
quer de determinados formatos e a constituio das competncias da equipe que o
produzir; realizando o design da interface na esttica do formato; realizando a edio
de udio e vdeo, possuindo o domnio de softwares para a produo hipermdia.
Tendo noes de Flash, com o uso de templates e das linguagens HTML, HTML 5,
CSS (Cascade Style Sheets), PHP, noes de gerncia de bancos de dados (MySQL,
PHP Admin) e prtica com publicadores de contedo, como WordPress e Joomla.
Daniela Bertocchi (2014) complementa que ainda importante a familiaridade do
jornalista com o funcionamento da modelagem de dados (dataentries) para sistemas
gerenciadores de contedos jornalsticos; otimizao de textos, imagens e afins (um
SEO); aplicao de algoritmos e inteligncia artificial no jornalismo; curadoria de
dados e informao; ser um jornalista que emita diversos tipos de informaes in
loco.

110

Captulo III

Escolhas e caminhos da modelagem jornalstica

Na produo jornalstica no ambiente online os profissionais podem escolher toda a


estrutura da formatao narrativa (BERTOCCHI, 2013), o template, o design de
informao, os fluxos de navegao, os metadados. Para Ramos (2011), Serres (2008)
e Bertocchi (2013), o formato pode at ter um formato-pai onde, por exemplo,
ocorra no a formatao da narrativa, mas o desenho do formato criando-se uma
forma de antenarrativa, um formato onde as histrias x,y, z podero ser trabalhadas de
uma determinada forma. O que os autores colocam que no ambiente digital, a
narrativa permaneceu como uma extenso, um fazer da maneira clssica no ambiente
digital, uma transposio dos gneros clssicos para a plataforma digital. Isso
aconteceu pelas razes j amplamente discutidas como a experincia prvia no meio
impresso. No entanto, os formatos narrativos digitais so diferentes dos gneros
tradicionais. A primeira distino em relao a complexidade da narrativa. No
jornalismo digital h inmeras camadas e agenciamentos em relao as possibilidades
de formatao narrativas (RAMOS, 2011). Os gneros jornalsticos so estveis e so
dependentes da audincia. (...) se o conceito de gnero surgiu a partir da lngua
natural, no possvel aplic-lo diretamente s linguagens artificiais geradas por
computadores no sentido de que so os gneros que designam os formatos.
(RAMOS, 2012, p. 44).

De acordo com a professora do Programa de Ps-graduao em Meios e Processos


Audiovisuais da Universidade de So Paulo Irene Machado (2007), o formato o
design de gnero167, onde o formato no configura um gnero, mas o design de
gneros. Enquanto o gnero discursivo da ordem da lngua, o formato da ordem
das linguagens modelizadas pelos cdigos culturais tecnolgicos. Para a pesquisadora,
no estando no ambiente semitico da codificao tecnolgica, o formato no pode
ser concebido.

Os gneros, ao serem redesenhados no contexto da mediao tecnolgica,


revelam a face metalingustica do formato: para criar linguagem preciso
processar linguagens e gneros. Logo, o formato uma noo que leva em
conta todo um ambiente ecolgico: a mdia (o sistema), os cdigos (as
linguagens) e as interaes possveis (as semioses). Fora dessas

167
A pesquisadora Irene Machado afirmou no artigo Gneros e/ou formatos? Design de linguagem mediada (2007), que o
formato a execuo de design, o produto de um design e defende a noo de formato como design de gnero.
(MACAHADO, 2007, p. 13)

111

Captulo III

disponibilidades de carter ecolgico, o formato no existe


(MACHADO, 2007, p. 13).

Para Daniela Ramos (2011), o formato funciona como um artefato de produo


jornalstica, de interao, condicionada pelo dispositivo. o resultado do desenho
informtico, o que pode conter muitas variveis, pois a execuo do design no
fsica, mas um processamento de cdigos e linguagens na tela digital, uma sntese do
design informtico. ao mesmo tempo um processo e um produto. No artigo Gneros
e/ou formatos? Design de linguagem mediada (2007), Irene Machado, defende que
seja como um processo ou como um produto, os formatos possuem uma lgica interna
em sua construo. H invenes nos cdigos culturais, mas tambm ocorre uma
combinao de conhecimentos cientficos e tecnolgicos que resultam na criao de
produtos. Elementos que juntos transformam a informao em mensagem.

Se, do ponto de vista dos cdigos, esta transformao representa um


processo modelizante, do ponto de vista dos conhecimentos de design de
informao que se trata. Considerando as implicaes mtuas entre
modelizao e design, entre o processo e o produto, a ao de transformar
a informao em mensagem cumpre um movimento de articulao de
signos e produz diferentes semioses e significaes. Neste funcionamento
se explicita a lgica interna do sistema em suas diferentes mediaes
semiticas, isto , a modelizao e o design da informao (MACHADO,
2010, p. 97).

A ideia de mltiplos formatos, distribudos em diferentes canais de comunicao e


dispositivos se configura na atualidade como uma nova mentalidade para as empresas
jornalsticas, pois apresenta para elas desafios nada simples de serem resolvidos,
como a formao do jornalista, integrao de redaes e nova organizao do fluxo de
trabalho. Refora que o sucesso do modelo de negcio das empresas jornalsticas
passa por essa nova conceituao dos formatos narrativos: uma produo de
informaes da marca jornalstica num fluxo contnuo independentemente do
dispositivo (papel, papel digital, computador vestvel ou outro qualquer), com
inovao, sinergia, integrao e muitas possibilidades em aplicativos para dispositivos
mveis; aes que poderiam compensar as perdas de receita as quais vm sofrendo
nas ltimas dcadas.

112

Captulo III

Podemos dizer, portanto, que a experincia narrativa contempornea sobre


a qual procuramos aqui refletir , em boa medida, costurada a partir de
variadas interfaces grficas acessveis via diversos dispositivos que, juntas
ou isoladamente, do ao usurio o contato com as histrias do cotidiano
escritas por jornalistas. Isso ocorre porque, no momento histrico em que
vivemos, os computadores esto engastados no meio ambiente de forma
visvel ou invisvel o que tem sido denominado por computao ubqua,
internet das coisas, ambient intelligence, smart things, computao fsica,
entre outros termos que dialogam entre si e tratam de um mesmo fenmeno
visto de perspectivas computacionais, culturais ou sociais (RESMINI &
ROSATI, 2011; GABRIEL; 2012 apud BERTOCCHI, 2013, p. 172)

Para Bertocchi preciso pensar o formato alm de um artefato, de uma entrega


final, mas sim como processo, fluxo, resultado do sistema aberto e em constante
adaptao. Assim, so identificados dois tpicos formatos: aquele que se
renderiza como uma visualizao de dados (ou formato guiado por dados e
metadados, o resultado do jornalismo de dados, o comportamento do sistema) e o
formato a partir de algoritmo (criado por diversos atores humanos e no-
humanos, como o algoritmo). Portanto, a observao do desenho do sistema
narrativo revela trs pontos importantes (BERTOCCHI, 2013, p. 208):

1) Dados, metadados e formatos tm a mesma importncia no processo de


composio da narrativa no jornalismo digital e ignorar uma dessas camadas pode
representar uma perda comunicativa. Isso significa afirmar que o modelo assume que
jornalistas desenvolvam competncias e habilidades para selecionar, confeccionar,
modelar, manipular e articular dados, metadados e formatos dentro de uma viso
sistmica do que seja narrar em meio digital;

2) Uma forma narrativa digital eficiente do ponto de vista informacional,


comunicacional, social, cultural e mesmo de modelo de negcio tende a se
concretizar mais naturalmente se o sistema narrativo tiver sido desenhado de antemo
para suportar e fomentar tal eficincia;

3) Inexistem valores-notcia que estimulem o jornalista a trabalhar em camadas mais


profundas da modelagem narrativa. Os conhecidos critrios de noticiabilidade no do
conta de estimular o jornalismo de dados ou a visualizao de dados.

Analisamos que nas camadas mais profundas e subterrneas do contexto


digital que so levadas a cabo decises e aplicadas estratgias pouco
familiares aos jornalistas. J nas camadas mais superficiais encontram-se
as decises mais prximas cultura jornalstica tradicional: o desenho da

113

Captulo III

interface do usurio (a vitrine), a escolha de ttulos, a disposio de


imagens, as possibilidades de hiperligaes de aprofundamento.
(BERTOCCHI, 2013, p. 210).

Ao mencionar este desenho da interface, falamos do design. O que para ns de


grande relevncia neste trabalho, uma vez que criar um design significa planejar,
desenvolver critrios e elaborar um roteiro para chegar a algum ponto.

Design



O design funciona como um desenho, uma construo da escrita digital. No livro O
Mundo Codificado, Villm Flusser (2007) aponta o design como central para a
linguagem e que os jornalistas precisam ter conscincia disso, de como funciona a
mquina, o algoritmo, que a codificao de uma srie de instrues em uma
linguagem. Onde acontece primeiramente o ato da estratgia a ser adotada, o desenho
de um processo, onde h fluxos a serem rastreados e estes fluxos podem ser
entendidos atravs do design. Isto se d pela capacidade de atribuir modelos para as
diversas ordens de cdigos envolvidos no processamento informtico (codificao,
decodificao e transcodificao).

Para Ramos (2011), o design um elemento estrutural do jornalismo de dados por ser
exatamente o processo de desenho que visa elaborao de um artefato que no caso
no fsico, mas sim as diferentes interfaces e formatos desenhados para organizar os
dados (RAMOS, 2011, p. 27). No falamos aqui de dados primitivos, constantes ou
variveis, que so da ordem da informtica e esto nos nveis de funcionamento
estruturais do sistema. Falamos dos dados que so arquivos de bits, que so
fotografias, vdeos, textos, animaes, mapas, tabelas. Elementos que so passveis de
associaes, comparaes e que potencialmente geram visualizaes. Dados que em
estado puro, no so informao, mas quando organizados em um formato, geram
informao jornalstica. Sendo, portanto, os formatos interfaces para os bancos de
dados. Por isso, conhecendo o processo de modelizao da linguagem de um
determinado texto da cultura, pode-se iniciar o processo de investigao de seus
sistemas modelizantes ou conhecer a estrutura sob a qual o texto funciona.

114

Captulo III

A forma de descrio de como o sistema deve proceder feita por


formatos e visa alcanar uma maior eficincia e clareza na linguagem de
modelagem. Como tambm estamos tratando de uma derivao da
modelagem, a modelizao do design informtico, cujo resultante o
formato, precisamos tambm operacionalizar este processo. Assim, para
criarmos formatos de informao jornalsticas digitais e a partir destes
formatos, as narrativas, ao invs de escrevermos um texto escrito para
encaix-lo em um formato televisivo, radiofnico ou impresso,
necessitamos projetar, desenhar, criar seu design. Este o sentido com o
qual usamos o termo design. A definio precisa do termo permite-nos
articular o conceito, o qual utilizamos para a defesa de nossa tese (...).
Assim podemos entender que o formato, modelizador das linguagens
digitais, modelizado pelo design informtico que, por sua vez, um
encadeamento de modelizaes de cdigos de vrias ordens, como
vimos, e que o formato tem, por fim, vrios nveis de modelizao que
so determinantes em sua apresentao (RAMOS, 2011, P. 46).

No curso sobre Visualizao de Dados e Infografia, ministrado pelo jornalista e


infografista Alberto Cairo (2014), aps a apurao dos dados, preciso fazer o
esquema, como apresentar os dados. Este esboo, geralmente, feito mo. O que
precisamos entender, so os processos. No so s produtos, so fluxos, onde o
jornalismo deve ser o centro da execuo. No s a visualizao, o conceito
envolvido que nos leva a entender o papel do design no ciberespao. H caminhos
tcnicos j traados que auxiliam a entender melhor este universo; h tcnicas sim,
mas preciso muito mais, preciso tambm trazer humanidade aos dados. De acordo
com Cairo (2014), fazer as perguntas certas e apresent-las da melhor forma possvel.

possvel decidir objetivamente sobre quais formas e grficos


so mais adequados? 1. Pense sobre a audincia e sobre a
publicao; 2. Pense nas perguntas que seu grfico deve ajudar os
leitores a responder; 3. Voc pode entend-lo sem ter que ler cada
figura? (CAIRO, 2014, traduo nossa)168

O doutor em Marketing pela Universidade da Virgnia, Andrew Abela, desenvolveu


alguns mtodos para o desenvolvimento de apresentaes de dados complexos e
informaes com grficos, principalmente voltado para empresas e baseado em vrios
estudos que incluram tambm diferentes reas de conhecimento, como psicologia,
marketing, comunicao e design. O diagrama desenvolvido por Abela, chamado

168
Is it possible to objectively decide which graphic forms are more appropriate? 1. Think about the audience and the
publication; 2. Think of the questions your graphic should help readers answer; 3. Can you understand it without reading every
single figure? (CAIRO, 2014). Slide referente a segunda semana de aula do curso de Visualizao de Dados e Infografia,
ministrado pelo prof. Alberto Cairo em abril de 2014.

115

Captulo III

Chart Suggestions A Thought-Starter (em portugus Sugestes de Grficos Uma


ideia inicial), por exemplo, serve como um guia para selecionar um grfico
apropriado. Este guia muito popular porque agrupa grficos por funo:
comparao, distribuio, composio e relacionamento. Ele baseado em extensa
pesquisa emprica e j foi testado entre diversas empresas como a Microsoft, a Exxon-
Mobil, a Kimberly-Clark, eBay e Motorola.

Figura III. 12 Verso do diagrama Chart Suggestions A Thought-Starter, de Andrew Abela

Fonte: TEIXEIRA, 2014, p. 137.

Como exemplo de uso deste guia, podemos citar a vertente relao. Caso os dados
possuam duas variveis para serem mostradas ao pblico, mais indicado o uso de
um grfico de disperso e caso possua trs ou mais variveis seria um grfico de
bolhas. H repleta bibliografia na rea; para muitos pesquisadores169 este prprio guia
chega a ser um pouco confuso e apresenta algumas falhas, sendo relevante leituras


169
A exemplo de FEW, Stefen (2015). Blog Stephen Few - Abelas Folly A Thought Confuser. Disponvel em:
https://www.perceptualedge.com/blog/?p=2080 - Abelas Folly A Thought Confuser. Acesso em 20 de janeiro de 2016.

116

Captulo III

mais aprofundadas nesta rea do design thinking170 e visual thinking (pensamento


visual)171 que servem como base para a matriz de construo de infogrficos. A
simples escolha de uma cor ou o formato de um grfico de barras devem ser guiados
pelos estudos j empreendidos na rea da percepo visual, uma vez que
determinados elementos visuais possuem resultados j identificados por serem mais
indicados para atender com propriedade as inclinaes e necessidades de nosso
crebro. Ns temos a tendncia natural do crebro em buscar equilbrio e harmonia
nas coisas ao redor e tambm em procurar por uma continuidade coerente. No a toa
que formas com aparncia distorcida podem provocar desconforto visual. Apesar de
no ser o foco desta pesquisa, como meio de contextualizao do processo de
visualizao de dados, vamos nos estender em elementos da visualizao da
informao para a compreenso de etapas que muitas vezes no aparecem para quem
apenas v o resultado final. So muitas idas e vindas dentro do sistema narrativo para
que o resultado obtido seja satisfatrio. Diversas adaptaes so necessrias nas peas
jornalsticas. O design algo adaptvel e mutvel de acordo com as condies no qual
exposto e a ferramenta que ser proposta segue essa mesma lgica.

H elementos estruturantes que participam da construo infogrfica. Ainda mais


quando falamos de peas que advm da visualizao de dados e que demandam
conhecimentos, como a programao em banco de dados, que no esto relacionados
diretamente rea de design, mas que podem resultar em um nvel de profundidade e
contribuio mais amplos. Para ns, o que mais relevante nesta pesquisa o que
defendem alguns autores da rea, como Edward Tufte e Alberto Cairo. Eles apontam
que os infogrficos devem priorizar elementos visuais que sejam de fato funcionais e
que contribuam para a eficcia do entendimento do assunto abordado, no sendo
apenas ornamentais. Ao abordar o pensamento visual, o autor Dan Roam (2012)
discute pilares que so os principais elementos presentes no processo de
desenvolvimento de infogrficos: 1 etapa: olhar ou coletar dados; 2 etapa: ver ou
selecionar e criar padres com dados; 3a etapa: imaginar ou estabelecer conexes no
aparentes; 4 etapa: mostrar ou traduzir visualmente as etapas anteriores com a


170
De acordo com a Wikipdia, Design Thinking o conjunto de mtodos e processos para abordar problemas, relacionados
aquisio de informaes, anlise de conhecimento e propostas de solues. Disponvel em:
https://pt.wikipedia.org/wiki/Design_thinking. Acesso em: 5 de abril de 2016.
171
Dan Roam, autor do livro The Back of the Napkin: Solving Problems and Selling Ideas with Pictures defende a ideia de que
possvel resolver problemas atravs da estruturao de estratgias com desenhos. O pensamento visual trata exatamente destas
modelagens aplicadas a negcios. Uma vez que um desenho pode facilitar a compreenso.

117

Captulo III

escolha de recursos grficos. A pesquisadora Carla Cristina da Costa Teixeira (2014),


em sua tese doutoral no Departamento de Artes & Design, na Pontifcia Universidade
Catlica do Rio de Janeiro aplicou com sucesso os conceitos de Dan Roam na
construo de infogrficos. Para ela, responder as perguntas propostas por Roan
ajudam a colocar o profissional do design no lugar do receptor:

(...) as perguntas tambm representam um exerccio para tentar captar que


perguntas o leitor gostaria que fossem respondidas pelo infogrfico,
ajudando o designer a se colocar na posio do receptor da mensagem
visual, e no apenas como mero emissor sem levar em considerao as
necessidades e peculiaridades dos indivduos para quem est se
comunicando, como faz um verdadeiro design thinker. (TEIXEIRA, 2014,
p. 162).

Para Roam, alguns designers tm o hbito de suprimir a etapa do olhar e coleta aos
dados ou faz-los, muitas vezes, de forma superficial Compreender o pensamento
visual como um processo pleno significa que o ponto de partida no aprender a
desenhar melhor; aprender a olhar mais atentamente (ROAM, 2012, p.46). O nvel
de profundidade da pesquisa de dados fundamental para a criao de boas peas,
cruzar dados e dar sentido a eles de forma visual. Esta fase do olhar tem um carter
imersivo sobre determinado assunto, de cunho investigativo e muitas vezes inclui
outros meios, como entrevistas, depoimentos, elementos que venham a contribuir para
o conhecimento. As etapas que se desenvolvem posteriormente so relevantes na
filtragem de informaes que sero apresentadas. Criaes de padres e organizaes
lgicas. Roam parte inclusive das perguntas-chave que nos lembram o lead
jornalstico: quem; o qu, quanto, onde, quando, como e porqu.

As demais etapas propostas por Roam remetem a apresentao dos contedos, de


imaginar a apresentao dos contedos. Imaginar a maneira como deixamos os
olhos de nossa mente assumirem o comando de modo que possamos ver coisas que
no esto fisicamente visveis (ROAM, 2012, p.90). onde a criatividade floresce,
que diante de um grande volume de dados, permite diversos caminhos. So feitas
adaptaes, escolhidas construes visuais de acordo com circunstncias e contextos
diversos.

118

Captulo III

Roan chega inclusive a sugerir seis maneiras de ver os dados e apresent-los, no


estilo qual a pergunta e qual recurso grfico melhor pode correspond-la (ROAM,
2012, p.128):

1. Quem/o qu? representao qualitativa retrato/ilustrao;


2. Quanto? representao quantitativa grfico;
3. Onde? posio no espao mapa;
4. Quando? posio no tempo linha do tempo;
5. Como? causa e efeito fluxograma;
6. Por qu? deduo e previso - grfico de variveis.

Carla Costa Teixeira, com base nos trabalhos de Roam, chegou a desenvolver uma
matriz de construo de um infogrfico:

Figura III. 13 Matriz de Construo Inforgrfica (TEIXEIRA, 2014)


Fonte: TEIXEIRA, Carla, 2014, p. 182.

119

Captulo III

So cinco as etapas da matriz de construo de infogrficos propostas por Teixeira


(2014, p. 179-182):

1 - Primeira etapa Definio Essa etapa se refere definio precisa do tema em


questo que ser abordado pelo infogrfico;
2 - Segunda etapa Pesquisa de dados Nesse momento o designer deve se abastecer
do mximo de dados possvel em relao ao tema definido na etapa anterior;
3 Terceira etapa Seleo de dados Essa fase se refere ao processo de selecionar
os dados que foram coletados para a construo do infogrfico, de acordo com uma
srie de critrios que devem ser estabelecidos pelo designer e tambm seguindo
tcnicas de seleo j mencionadas na pesquisa;
4 Quarta etapa Estudos de layout A ferramenta sugerida para comear a pensar
como traduzir visualmente os dados selecionados para o infogrfico o SQVID172,
que aciona o modo imaginar presente no mtodo proposto por Dan Roam. Alm
disso, estimula o designer a realizar conexes entre os dados que a princpio no eram
aparentes, auxiliando no processo de descobrir, aprofundar e elucidar questes para o
pblico-alvo da pea grfica;
5 Quinta etapa Implementao - A etapa final da matriz de construo definida
pela escolha de um dos estudos de layout ou ento a partir do cruzamento de mais de
um deles.

Concordando com Ramos (2011), acreditamos que os aspectos do formato do design


digital no se restringem rea de navegao na tela, prpria navegao ou a
rolagem. O formato resultado do desenho informtico, o que pode conter muitas
variveis, pois a execuo do design no fsica e palpvel, mas um processamento
de cdigos e linguagens na tela digital, uma sntese do design informtico(RAMOS,
2011, p. 45). Os formatos esto armazenados em bancos de dados de empresas
jornalsticas e acessados pelos usurios que solicitam o formato por meio de um
clique de mouse em interfaces variveis.


172
A sigla SQVID foi elaborada por Roam (2012, p. 98) e corresponde a primeira letra de atributos a serem respondidos por
cada uma das perguntas: S (simples ou elaborado), Q (qualidade ou quantidade), V (viso ou execuo), I (atributos individuais
ou comparao) e D (mudana ou status quo). Foram escolhas do autor para facilitar a leitura e memorizao destes atributos.

120

Captulo III

Certamente, os dispositivos de acesso podem mudar nos prximos


anos, a exemplo do IPhone, da Apple, cuja interface manipulada
atravs do toque na tela, assim como o iPad, lanado em 2010,
todos com uma tecnologia proprietria, j que alguns movimentos
que fazemos para acessar o touchscreen destes dispositivos so
patenteados pela empresa. Neste caso, as particularidades de
funcionamento dos dispositivos condicionam a gerao dos
formatos (RAMOS, 2011, p. 47).

De acordo com o pesquisador Eduard Tufte, no livro The Visual Display of


Quantitative Information (1983), h muito chartjunk, ou seja, lixo grfico. O autor
considera que esses elementos apenas contribuem para poluir visualmente a pea
grfica e tirar a ateno do que seria realmente importante em termos de contedo.
Fato que tambm foi evidenciado na pesquisa desenvolvida por Giannella (2014), na
anlise de 270 peas grficas de infogrficos. De acordo com ela, as ferramentas
online e gratuitas avanam em termos de armazenamento e organizao de dados,
agilidade e baixo custo de produo das peas; mas por outro, podem ser limitadas em
termos de raciocnio e imaginao. Os problemas tambm giram em torno da
incompatibilidade do projeto grfico do veculo, da compartimentao das
informaes em blocos e do modo de organizao no condizentes com a natureza
dos dados:

incompatibilidade ou contraste com o projeto grfico do veculo


de comunicao em termos de: escala de cor, tipografia,
diagramao dos elementos visuais e textuais;
compartimentao da informao em blocos: criao de duas ou
mais representaes grficas com diferentes ttulos, dispostas
verticalmente na pgina, fragmentando o contedo e dificultando
a relao entre os dados visualizados;
modo de organizao da informao no condizente com a
natureza e relao dos dados que deveriam ser evidenciados.
(GIANNELLA, 2014, p. 127).

A criao de programas e algoritmos que substituem o trabalho humano de


reportagem envolve uma srie de decises que devem ser passveis de explicao e
responsabilizao para todos os afetados. Aplicativos de softwares baseados na web
precisam da mediao humana, profissional, para emergir e interpretar as
informaes. No basta torn-las acessveis ou legveis; preciso torn-las
compreensveis e relevantes, ter valor jornalstico.

121

Captulo III

Valor na contemporaneidade


Como j apontado no incio deste captulo (pgina 102), concordamos com
ANDERSON, BELL & SHIRKY (2012), com o fato de que jornalista foi deslocado
na cadeia editorial e hoje no produz informaes iniciais. O profissional exerce a
funo de verificar, interpretar e dar sentido enxurrada de textos, udios, fotos e
vdeos produzidos pelo pblico e/ou que so de interesse e necessidade de
conhecimento do pblico. No relatrio do Tow Center for Digital Journalism da
Columbia Journalism School, os pesquisadores reforam a ideia de que neste novo
contexto cultural, o jornalismo afetado em trs grandes reas: no fazer jornalismo,
na instituio jornalstica e no ecossistema de mdias. Por exemplo, TV e redes
sociais, uma das dinmicas a presena da segunda tela. Entre os apontamentos para
os jornalistas tanto do mercado formal, quanto do informal teremos a credibilidade do
jornalista cada vez mais no nome do profissional e um jornalismo mais militante,
opinativo. Entre as habilidades que o contexto cada vez mais vai pedir esto
narrativas e novas alfabetizaes jornalsticas. A originalidade no raciocnio, que deve
provocar mudanas, incitar a ao e o carisma, uma vez que gente segue gente,
ainda mais em um mundo de redes onde as conexes esto facilitadas.

O jornalismo uma ferramenta, mas no somente tcnica. As questes envolvem


contextualizaes e a prtica profissional deve estar associada ao contexto social e
cultural. Jornalismo no informao primria e neste sentido a apurao a
ferramenta fundamental que justifica a presena da profisso, que s ter o
desenvolvimento da utilidade do contedo com a compreenso das relaes de poder,
as tradues e desvendamentos destas relaes no mbito social. Nesse novo
ecossistema torna-se relevante entender o que novos atores podem fazer hoje melhor
que o jornalismo de modelos anteriores? Que papel o jornalista pode desempenhar
melhor do que ningum? O que os novos atores, softwares fazem melhor que os
jornalistas? Para a pesquisadora Daniela Osvald Ramos (2015, anotaes)173 preciso
pensar o jornalismo fora do jornalismo. Quanto mais esse processo acontecer, mais
divertido, mais produtivo, mas criativo o jornalismo ser. Devemos encarar a
experimentao voltada inovao como algo a praticar e no simplesmente tolerar,

173
Em aula realizada na Universidade de So Paulo no dia 27 de abril de 2015, disciplina Jornalismo Online.

122

Captulo III

disse. Precisamos tambm bancar a humanidade, trazer as pessoas para os dados,


complementou Ramos.

Em meio as mudanas e as adaptaes de novas formas de contar histrias baseadas


em dados aparecem novas possibilidades para o jornalismo. No entanto, elas exigem
diferentes formas de organizao e, como j mencionado, somente incorporar tcnicas
no sero suficientes para a adaptao a este ecossistema. Torna-se importante refletir
sobre a formao dos jornalistas nas universidades brasileiras sob a perspectiva das
habilidades e competncias necessrias para o fomento do pensamento computacional
no jornalismo.

() talvez no seja possvel competir com o mercado informativo atual se


no se conta com especialistas em reunir, organizar e interpretar nmeros;
ou, em outras palavras, em d-los sentido e apresent-los visualmente de
maneira que possam ser aprendidos e estudados (CAIRO, 2011, traduo
nossa)174


O jornalista potencialmente um designer de experincia. Ele no apenas "escreve o
texto", mas a figura tambm capaz de modelar a narrativa em camadas, com equipes
humanas e robs, tendo como objetivo uma experincia narrativa centrada nos
usurios. Se familiarizado com as camadas mais subterrneas do sistema narrativo, o
jornalista poderia atuar mais no remodelamento do sistema, encontrando e criando
oportunidades de melhor comunicar suas histrias no ciberespao. O formato
visualizao de dados tem processos prprios e estes processos dependem dos dados,
das linguagens, das ferramentas, assim como dos locais de armazenamento e formas
de resgate.

Consideraes

Neste captulo sustentamos que o jornalismo de dados e a visualizao de dados esto


inseridos em sistemas narrativos condizentes com processos inovadores no jornalismo
contemporneo, onde o jornalista no somente um narrador de fatos, ele o


174
Tal vez no sea posible competir en el mercado informativo actual si no se cuenta con especialistas en reunir, organizar e
interpretar nmeros; o, en otras palabras, en darles sentido y presentarlos visualmente de manera que puedan ser aprehendidos y
estudiados (CAIRO, 2011). Disponvel em: http://blogs.elpais.com/periodismo-con-futuro/2011/04/periodismo-de-precision-
visualizacion-datos.html. Acesso em Visualizado em 15 de abril de 2014

123

Captulo III

responsvel por coletar, apurar, interpretar e contextualizar as informaes. Recorre a


grficos interativos, solicita imagens e informao ao pblico/leitor, disponibiliza
acesso direto a bancos de dados e distribui matrias por redes sociais.

Defendemos que o jornalista no foi substitudo e muito menos extinto, mas sim,
neste cenrio, exerce funes de verificar, interpretar e dar sentido enorme
quantidade de textos, udios, fotos, vdeos em narrativas originais e criativas. um
curador de notcias que se familiarizado com as camadas subterrneas do sistema
narrativo encontra melhores maneiras de contar histrias. Neste sistema narrativo
atuam diferentes atores humanos e no-humanos, em construes iniciadas em
codificaes maqunicas, com bases de dados que dialogam com outras camadas at
chegar a uma interface com o usurio. O usurio, por sua vez, d continuidade ao
fluxo informativo comentando, compartilhando, se apropriando e resignificando o
contedo a que teve acesso.

Novas possibilidades para o jornalismo levam a diferentes formas de organizao e


somente a incorporao de tcnicas no sero suficientes para a adaptao a este novo
ecossistema. preciso dar valor e funcionalidade ao jornalismo retomando perguntas
fundamentais para o exerccio da profisso: o que possvel fazer hoje melhor do que
o jornalismo de modelos anteriores? Que papel o jornalista desempenha melhor do
que ningum? O que os novos atores, softwares, fazem melhor que os jornalistas?
Onde, neste processo, os jornalistas fazem a diferena?

A produo jornalstica no ambiente online complexa, com inmeras possibilidades


e camadas de formatao narrativa. O design passa a ser um elemento estrutural no
jornalismo de dados, uma vez que o responsvel pelo desenho, pela a organizao
dos dados em formatos, sendo, portanto, estratgico. Os profissionais envolvidos
podem escolher toda a estrutura: template, design, navegao, metadados. Pode at
existir um formato-pai, mas est longe de ser a maneira clssica do jornalismo. Os
formatos narrativos digitais so diferentes dos gneros tradicionais. Enquanto o
gnero discursivo da ordem da lngua, o formato da ordem das linguagens
modelizadas pelos cdigos culturais tecnolgicos.

124

Captulo III

A complexidade contempornea tambm refletida nos estudos da rea, uma vez que
so necessrios diferentes olhares e reflexes terico-metodolgicas para entender os
fenmenos. No quarto captulo se encontram os caminhos metodolgicos percorridos
nesta pesquisa e os rumos para as observaes de campo que sero apresentadas no
captulo V.

125

Captulo IV

IV. CONSTRUINDO A PARTIR DA DESCONTRUO CONSIDERAES


METODOLGICAS

Resumo: O que a visualizao de dados no jornalismo? Como ela se insere na


prtica e na narrativa do jornalismo de dados proporcionando diferenciais relevantes?
Este captulo tem por objetivo apontar os caminhos metodolgicos percorridos para
tentar resolver os questionamentos deste estudo. Foi adotada uma pesquisa
multimetodolgica tendo os pressupostos da centralidade, transversalidade e
resilincia na busca de diferentes olhares a partir dos dados.

Palavras-chave: Pesquisa multimetodolgica; Pesquisa Emprica em Comunicao;


Estudo de Caso; Grounded Theory

"Embora seja fcil mentir com estatsticas, ainda mais fcil de


mentir sem elas." (Frase atribuda ao estatstico americano
Frederick Mosteller, presente na obra de Charles Murray, 2005,
traduo nossa)175

Diferentes olhares

Foram inmeros os desafios desta pesquisa, no menos complexo o de como trabalhar


a metodologia e anlise dos dados. Um assunto dinmico, ainda com poucas
referncias, exigiu de ns um olhar multidisciplinar, que confrontou teorias e mtodos
de investigao. O texto Centralidade, transversalidade e resilincia: reflexes sobre
as trs condies da contemporaneidade digital e a epistemologia da Comunicao,
da pesquisadora Elizabeth Saad (2015), veio nos auxiliar e ampliar horizontes sobre
como posicionar nosso estudo no cenrio contemporneo. Ele sintetiza as
caractersticas e, por consequncia, os desafios dos estudos em Cincias da
Comunicao envolvendo as temticas da mdia digital, cibercultura, mdias sociais,


175
"While it is easy to lie with statistics, it is even easier to lie without them" (Charles Murray). Disponvel em:
http://www.jstor.org/stable/20061179?seq=1#page_scan_tab_contents. Acesso em 16 de marco de 2016.

126

Captulo IV

do cenrio contemporneo que exige diferentes reflexes terico-metodolgicas para


entender os fenmenos da rea.

Partindo de uma centralidade da comunicao, concordamos com Saad que no


podemos mais distinguir um espao especfico para o estudo do digital dentro da
Comunicao. As Tecnologias Digitais de Informao e Comunicao atravessam,
transversalmente, todas as atividades comunicativas e informativas sejam elas
analgicas e/ou off-line, o que requer resilincias em relao estruturao das
abordagens terico-metodolgicas que sustentam as pesquisas e reflexes do campo.
As fronteiras do campo de estudos passam por processos de dissoluo diante dos
diversos paradigmas-teorias-modelos-metodologias vinculados delimitao da
Comunicao como campo de estudo da transmisso de mensagens por meio de
dispositivos de mdia (SAAD, 2015, p.3). H uma maior complexidade dos estudos
de Comunicao no estreitamento com as Tecnologias Digitais de Informao e
Comunicao e a necessidade de convivncia com reinterpretaes dos fenmenos
como interatividade, midiatizao, virtualidade.

A diversidade de plataformas miditicas traz o desafio de conceituaes e


operacionalizaes de mltiplas mdias. Ao abordar a complexidade, nos remetemos
ao que Edgar Morin (2006) vem discutindo e com a proposta de uma viso mais
ampla percebemos que a traversalidade, como apontado por Saad, passa a ser uma
capilaridade das tecnologias digitais, de atuao simultnea:

A transversalidade capilaridade das tecnologias digitais atuando


simultaneamente nos processos que operam as atividades comunicativas,
nos sistemas que integram processos anteriormente fragmentados, nos
dispositivos cada vez mais convergentes devido s affordances que
incorporam funes de mobilidade e geolocalizao, interatividade aos
suportes comunicativos clssicos, e nos prprios produtos miditicos
(SAAD, 2015, p. 6).

Tendo a centralidade da Comunicao no tecido social e a presena do digital de


forma transversal nos processos, produtos e prxis do campo, Saad aponta a
resilincia como condio para a estruturao epistemolgica. Uma resilincia
benfica na possibilidade de incorporao de teorias/modelos/metodologias de
campos correlatos Comunicao e que por consequncia facilitam outros saberes.

127

Captulo IV

Entendemos aqui por resilincia a capacidade de um sistema ou uma


organizao se antecipar e se adaptar a rupturas, eventos, lidar com as
mudanas e reconstruir seus valores e estruturas a partir destes
movimentos. Numa visada objetiva e sem qualquer carter de crtica,
assistimos hoje a um processo de busca de diferentes vertentes tericas,
multiplicidade de autores e propostas metodolgicas para a sustentao
epistemolgica de estudos e pesquisas que envolvam a questo digital na
Comunicao, seja ela vista como um elemento transversal nos processos
ou nos produtos, seja como elemento central de discusso (SAAD, 2015,
p.9).

Para ns, a metodologia deve ser analisada no somente como tcnica de pesquisa,
mas como a explicitao da construo do objeto e dos aspectos metatericos,
epistemolgicos da pesquisa. Em suma, refletem tambm as escolhas do pesquisador.
Trata-se, portanto, da percepo de um sujeito que sofre influncias dos
condicionantes sociais. preciso pesquisar com seriedade e consciente das
dificuldades do trajeto. Neste projeto, viu-se os fenmenos da comunicao digital
como manifestaes da comunicao humana, onde os contedos, que ocorrem no
ambiente tecnolgico dos bits e que utilizam ferramentas tcnicas possibilitam
promover trocas, interaes, relaes de sociabilidade.

Diante da complexidade da temtica na contemporaneidade foi adotada uma


estratgia multimetodolgica envolvendo reviso bibliogrfica, observao no
participante orientada pela Pesquisa Emprica em Comunicao (LOPES, 2010),
estudo de caso (YIN, 2001) do blog Estado Dados, do jornal O Estado de S. Paulo e,
posteriormente, pressupostos da Grounded Theory (TAROZZI, 2011) para o olhar
mais detalhado sobre o fenmeno estudado.

O esquema da figura a seguir mostra o caminho percorrido para a familiarizao com


o tema at a aplicao dos princpios da Grounded Theory (GT). Princpios, porque a
proposta deste estudo no foi a busca por uma teoria, mas obter informaes a partir
de diferentes olhares e deixar tambm que os dados falassem por si, questes que
explicaremos melhor ao longo deste captulo.

128

Captulo IV

Figura IV. 14 Familiarizao com o tema visualizao de dados



Reviso da Disciplinas
literatura cursadas




Artigos

publicados




Observao
Participao em
emprica em Grupos Com+
Congressos
sites nacionais




MOOCs Reviso da PAE
literatura





Qualificao





Grounded
Theory

Fonte: Mayanna Estevanim, 2016.

As escolhas aqui se deram pela necessidade de cercar o objeto e tentar compreend-lo


por diversos pontos de vista, principalmente por estar em uma rea inovadora de
conhecimento e transdisciplinar; em uma zona fronteiria onde o consumo e a

129

Captulo IV

produo de contedos apresentam distines em relao a prticas de outros


momentos histricos; onde os recursos tecnolgicos possibilitam novos fazeres
jornalsticos, novas formas de interao. Alm da reviso da literatura e das
disciplinas cursadas 176 , diversas atividades complementaram os estudos. Foram
artigos publicados177, observao emprica em sites nacionais, MOOCs178, PAE179,
congressos e discusses no grupo de pesquisa COM+180. Buscamos atravs do
caminho metodolgico saber como o jornalismo de dados, em mbito nacional, vem
utilizando a visualizao de dados. O que a visualizao de dados no jornalismo e
como ela se insere na prtica e na narrativa do jornalismo de dados proporcionando
diferenciais relevantes.

ETAPA - pesquisa bibliogrfica

Levantamento bibliogrfico que permitiu compreender melhor os estudos do


jornalismo digital em base de dados, da visualizao de dados e do jornalismo ps-
industrial. De acordo com a professora Maria Immacolata Vassalo de Lopes (LOPES,
2010), alm do universo terico feito a partir do paradigma cientfico, a pesquisa
bibliogrfica visa situar o problema em relao s pesquisas existentes, mesmo
aquelas de orientaes tericas diferentes. Visa descrever o estado de conhecimento
sobre o objeto, o que j foi estudado sobre ele.

176
1- Metodologia da Pesquisa em Comunicao; 2- Teorias da Produo Partilhada do Conhecimento em Comunicao Digital:
Comunidade e Universidade; 3- Mdias Sociais Audiovisuais e o Espao Pblico Contemporneo: Prticas e Processos em
Mutao; 4- Comunicao e Redes na Era Digital: Pensamento Contemporneo e Tendncias Tecnolgicas; 5- Epistemologias
Reticulares: Questes Sobre o Mtodo no Estudo das Redes Digitais e Perspectiva de Conhecimento Atravs da Interao com
Computadores.
177
O artigo Visualizao de Dados Complexos no Jornalismo Digital: uma reflexo sobre os conceitos de dispositivo foi
publicado nos anais do Intercom Nacional, GP Teoria do Jornalismo, XIV Encontro dos Grupos de Pesquisa em Comunicao,
evento componente do XXXVII Congresso Brasileiro de Cincias da Comunicao realizado em Foz do Iguau (PR), entre 2 e 5
de setembro de 2014. O artigo Jornalisticar - Expertises na Visualizao e no Jornalismo de Dados no Digital, ser publicado
nos anais do VIII Simpsio Nacional da ABCiber, realizado entre 3 e 5 de dezembro de 2014, na Escola Superior de
Propaganda e Marketing (ESPM), em So Paulo. O artigo Formatos digitais e qualidade no jornalismo brasileiro em base de
dados, de autoria conjunta com as professoras Daniela Osvald Ramos, da Universidade de So Paulo e Egle Mller Spinelli,
da Universidade Anhembi Morumbi foi publicado nos anais do IV Congresso Internacional de Ciberjornalismo, realizado
nos dias 4 e 5 de dezembro de 2014 na Faculdade de Letras da Universidade do Porto. O artigo Visualizao de dados
complexos no jornalismo digital entrar nos anais da V Jornada Acadmica Discente PPGCOM USP, realizado em 10 de
dezembro de 2014, na Escola de Comunicaes e Artes, da Universidade de So Paulo. O artigo Visualizao de dados
complexos no jornalismo e os estudos de redes sociais digitais na contemporaneidade entrar nos anais do XIV Congresso
Ibero-americano de Comunicao IBERCOM 2015, realizado entre 29 de maro e 02 de abril de 2015, na Escola de
Comunicaes e Artes, da Universidade de So Paulo.
178
Realizao do curso massivo e aberto Visualizao de Dados e Infografia, da University of Texas at Austin em parceria com o
Knight Center Journalism in the Americas, entre os dias 14 de abril e 12 de maio de 2014, ministrado pelo jornalista e professor
da School of Communication of the University of Miami, Alberto Cairo. Realizao do curso massivo e aberto Herramientas
Digitales para el Periodismo de Datos, da University of Texas at Austin em parceria com o Knight Center Journalism in the
Americas, entre os dias 18 de agosto e 21 de setembro de 2014, ministrado pela jornalista e professora Sandra Crucianelli. Curso
Math for Journalists Made Easy: Understanding and Using Numbers and Statistics, entre os dia 1o e 28 de junho de 2015,
realizado pela University of Texas at Austin. Curso Lgica de programao, realizado em 1o de julho de 2015, pela Softblue.
179
O estgio no Programa de Aperfeioamento do Ensino foi realizado no 2o semestre de 2014 e no 1o semestre de 2015, ambos
na disciplina Jornalismo On-line, Escola de Comunicao e Artes.
180
http://grupo-ecausp.com/2010/05/grupo-pesquisa-commais/

130

Captulo IV

Acumula-se uma documentao sobre o objeto que fornece o estado atual


do conhecimento sobre o tema de pesquisa, isto , o que se diz dele. Esse
levantamento bibliogrfico, quando bem realizado, oferece textos de apoio
a todas as dimenses da pesquisa, envolvendo questes epistemolgicas,
tericas, metodolgicas e tcnicas (LOPES, 2010, p. 148).


2. ETAPA Definio inicial das categorias de observao e busca dos veculos de
comunicao para anlise

Primeiramente foram buscados critrios que indicassem que o contedo fazia parte do
Jornalismo Digital de Base de Dados. Em um segundo momento critrios que
determinassem que se tratava de uma visualizao de dados e em um ltimo
momento, diante do avano das observaes do estudo, foram definidos os critrios
de observao envolvidos no processo da visualizao de dados, para que a partir
destes apontamentos fosse possvel chegar ao veculo que seria fruto do estudo.
Vamos a eles:

a) O JDBD prev funes para as bases de dados que, em sua maioria, se relacionam
com o sistema narrativo. Com base no trabalho iniciado por Susana Barbosa (2008), a
pesquisadora Daniela Bertocchi (2013) fez um recorte de quais funes impactam
mais diretamente no sistema narrativo:

Indexar e classificar as peas informativas e os objetos multimdia; -


Integrar os processos de apurao, composio e edio dos contedos; -
Conformar padres novos para a construo das peas informativas; -
Propiciar categorias diferenciadas para a classificao externa dos
contedos; - Estocar o material produzido e preservar os arquivos
(memria), assegurando o processo de recuperao das informaes; -
Permitir usos e concepes diferenciados para o material de arquivo; -
Garantir a flexibilidade combinatria e o relacionamento entre os
contedos; - Gerar resumos de notcias estruturados e/ou matrias de modo
automatizado; - Armazenar anotaes semnticas sobre os contedos
inseridos; - Habilitar o uso de metadados para anlise de informaes e
extrao de conhecimento, seja por meio de tcnicas estatsticas ou
mtodos de visualizao e explorao como o data mining; - Orientar e
apoiar o processo de apurao, coleta e contextualizao dos contedos; -
Regular o sistema de categorizao de fontes jornalsticas; - Sistematizar a
identificao dos profissionais da Redao; -Cartografar o perfil dos
usurios; - Transmitir e gerar informao para dispositivos mveis
(celulares, computadores de mo, entre outros). (BERTOCCHI, 2013, p.
33).

131

Captulo IV

Como forma de delimitao, partimos das categorias descritivas adotadas por


BARBOSA (2008) no JDBD: dinamicidade; automatizao; inter-relacionamento e
hiperlinkagem; flexibilidade; densidade informativa; diversidade temtica e
visualizao. Para Bertochi (2013), a visualizao se manifesta no momento de
narrao (formatao narrativa), enquanto que os demais critrios podem ser
observados no momento de antenarrativa. A visualizao de dados, no entanto, possui
em sua sistemtica um ir e vir dentro do sistema narrativo (fato mencionado no
captulo III).

b) A partir destas primeiras categorias foram adotados critrios mais especficos de


observao. De acordo com Cairo (2011), a visualizao de dados a disciplina que
se ocupa de criar ferramentas visuais, as vezes interativas, para que uma determinada
audincia, geralmente composta por pesquisadores e acadmicos, possam estudar e
explorar os dados. Em uma visualizao o usurio ocupa o lugar de editor elegendo
quais dados quer ver e como quer v-los.

A forma de apresentao e de explorao so funes que caracterizam e separam a


infografia da visualizao de dados como contedo final apresentado ao leitor. Para
tanto, como forma de delimitao, observamos quais contedos agregavam grande
volume de dados e permitiam que o usurio construsse suas narrativas e explorasse
um grande volume de dados de forma visual.

3. ETAPA Coleta de dados para contextualizao

a) Paralelamente segunda etapa foram levantadas iniciativas que tiveram como foco
a visualizao de dados e o jornalismo: congressos, premiaes, blogs, cursos online
gratuitos na rea de visualizao, buscas para contextualizar a prtica em mbito
nacional e internacional.

b) Observao no-participante de iniciativas jornalsticas em visualizao de dados


em veculos de grande mdia nacionais e internacionais. O processo de observao
aqui descrito faz parte da segunda fase da pesquisa emprica em Comunicao

132

Captulo IV

(LOPES, 2010), onde o trabalho passou a adquirir mais corpo diante dos fenmenos
acompanhados.

A observao o momento da ruptura epistemolgica na prtica e, como o processo


de construo dos dados da pesquisa, abrange duas operaes: amostragem e coleta
dos dados. Para atender a proposta deste estudo foi adotada uma combinao de
observaes diretas e indiretas, a partir de entrevistas, observao no-participante e
participaes em cursos, palestras e grupos de discusso com temticas
correlacionveis. Tendo em vista que as tcnicas de coleta escolhidas do significado
epistemolgico ao tratamento do objeto e tambm terico aos problemas que se
apresentam a este objeto, foram adotadas prioritariamente as de amostragem no-
probabilstica, de dados qualitativos, uma vez que na amostra no probabilstica a
inferncia estatstica no pode ser legtima, uma vez que o pesquisador no conhece a
probabilidade que cada unidade tem de ser selecionada para fazer parte da amostra.
(LOPES, 2010, p. 145). Abordamos um fenmeno recente, ainda em construo e
desenvolvimento. No temos, portanto, fundamentos para generalizar situaes ou
condicionar os fenmenos de alguma forma.

4. ETAPA estudo de caso

A partir dos referenciais tericos adotados e do paradigma Jornalismo Digital de Base


de Dados foi selecionado o blog Estado Dados, do jornal O Estado de S. Paulo, para
o estudo de caso. A escolha se deu por ter no blog tanto contedos grficos, quanto
projetos em visualizao, pelas constantes atualizaes de contedo e por estar em um
cenrio brasileiro de investimentos nesta rea. Assim, pudemos aprofundar a temtica
da visualizao de dados no jornalismo de dados, uma vez que o estudo de caso
possibilita uma maneira de se investigar um tpico emprico seguindo-se de um
conjunto de procedimentos pr-especificados (YIN, 2001, p. 35). Visamos nos
debruar sobre os fenmenos contemporneos da visualizao de dados e questionar a
prtica no jornalismo de dados no cenrio nacional. O estudo de caso sustentado por
teoria e visa a reunio do maior nmero possvel de informaes por meio de
diferentes tcnicas de levantamento de dados, que para solucionar o problema,

133

Captulo IV

ressaltam o como e o por que do fenmeno. A triangulao de informaes,


dados e evidncias garantem a confiabilidade e a validade dos achados do estudo.

Busca-se, criativamente, apreender a totalidade de uma situao


identificar e analisar a multiplicidade de dimenses que envolvem o caso
e, de maneira engenhosa, descrever, compreender, discutir e analisar a
complexidade de um caso concreto (...) (MARTINS, 2008, p. 10).

Esta metodologia caracterizada pelo estudo profundo e exaustivo de um ou de


poucos objetos, que permitem um conhecimento mais amplo e detalhado do objeto
(GIL, 1994). Exatamente o que precisamos para a compreenso aqui proposta, o
conhecimento de uma realidade no conseguida plenamente por uma coleta amostral e
avaliaes quantitativas. De acordo com o pesquisador Robert Yin (2011) bons
estudos de caso so difceis de serem realizados. Para ele, uma pesquisa emprica
fundamentada no mtodo de estudo de caso deve ter como componentes questes do
estudo, proposies, unidades de anlise, lgica que une os dados s preposies e
critrios para interpretar os resultados. Um estudo de caso uma investigao
emprica que estuda fenmenos contemporneos em seu contexto real, quando: (i) no
esto claramente definidos os limites entre o fenmeno e o contexto; (ii) existem mais
variveis de interesse do que pontos de dados; (iii) se baseia em vrias fontes de
evidncias; e (iv) h proposies tericas para realizao da coleta e anlise dos
dados.

Yin define que existem quatro tipos de projetos na estratgia de um estudo de caso:
projetos de caso nico e projetos de caso mltiplos, ambos podem ser holsticos ou
incorporados. Em um estudo de caso nico pode se dar ateno a uma unidade de
anlise ou a vrias unidades incorporadas. Essa distino na quantidade de unidades
que define se um estudo de caso holstico ou incorporado. holstico quando se tem
apenas uma unidade de anlise e incorporado quando se tem mais de uma. Outro
ponto a ser considerado, que distingue os dois casos, a presena de dados
quantitativos nos casos incorporados, a exemplo dos levantamentos. Dentro do
mtodo cientfico pode-se optar por abordagens quantitativas ou qualitativas. A
pesquisa quantitativa traduz em nmeros as opinies e informaes a serem
classificadas e analisadas, utiliza-se de tcnicas estatsticas. J a pesquisa qualitativa

134

Captulo IV

descritiva, as informaes no podem ser quantificveis, os dados obtidos so


analisados indutivamente e a interpretao dos fenmenos e a atribuio de
significados so parte do processo de pesquisa (RODRIGUES, 2007). Neste estudo
optamos pelo estudo de caso nico (blog Estado Dados), dando ateno a mais de
uma unidade de anlise, sendo portanto incorporado.

Optou-se pelo paradigma Jornalismo Digital de Base de Dados por ser um modelo
terico formulado para auxiliar no entendimento do papel das bases de dados no
jornalismo contemporneo que permitem a criao, a manuteno, a atualizao, a
disponibilizao e a circulao de produtos jornalsticos digitais dinmicos
(BARBOSA, 2008 / BARBOSA & TORRES, 2013).

Para chegarmos proposio de bases de dados como um paradigma no


jornalismo digital, construmos uma abordagem terica fundamentada num
marco conceitual abrangente, indo um pouco alm dos limites do
jornalismo e do jornalismo digital. Buscamos embasamento nos estudos
sobre os meios, sobre a internet, a nova mdia, a teoria da difuso de
inovaes, a teoria literria, a teoria crtica, a web arte, os sistemas de
informao, as tecnologias da informao e comunicao, as linguagens de
programao, as tcnicas de descoberta de conhecimento entre os dados e
os mtodos para a visualizao de informaes. (BARBOSA, 2008, p.
219).

No estudo de caso proposto nesta dissertao observamos, em concordncia com


Bertocchi (2013), que a categoria visualizao manifestou-se no momento de
antenarrao do processo de formao narrativa. Optando-se por um estudo de caso
nico incorporado, uma vez que foram trabalhados tanto os projetos especiais181,
quanto os permantentes182 do blog Estado Dados. No entanto, descrever um contexto
ou explorar em profundidade as vivncias de determinados sujeitos ainda no atendia
a proposta de compreenso da visualizao de dados diante das complexidades
contemporneas. Sentamos que haviam mais elementos. Como forma de
aprofundar o estudo e tentar abarcar o fenmeno, aps a qualificao realizada
em 26 de junho de 2015 foram adotados princpios da Grouded Theory como
mtodo investigativo. Eles foram uma escolha apropriada para fazer emergir os
processos subjacentes s afirmaes dos participantes e aos fenmenos
observados. Com isto, a pesquisa foi dimensionada e passou a ser uma

181
Disponvel em: http://blog.estadaodados.com/projetos-estadao-dados/
182
Disponvel em: http://blog.estadaodados.com/permanentes/

135

Captulo IV

construo criativa a partir dos dados, capaz de explicar os fenmenos


pesquisados. No entanto, no adotamos esta metodologia por completo, uma vez
que no nossa inteno neste estudo elaborar uma teoria sobre a temtica, mas
sim estudar o objeto por outros ngulos.

Tendo ausncia de hiptese prvia e de problema de pesquisa fechado, partimos da


pergunta gerativa aberta, do incio do estudo: O que a visualizao de dados no
jornalismo? Como ela se insere na prtica e na narrativa do jornalismo de dados
proporcionando diferenciais relevantes? A literatura cientfica e os caminhos
anteriores aos princpios da Grouded Theory possibilitaram um maior conhecimento
sobre a rea, o que ficou registrado em artigos que abordaram temas correlatos ao
investigado nesta dissertao. Apesar de no ter um nico caminho de investigao,
h pesquisadores que defendem que em um estudo utilizando a GT no devemos
partir de pressuposto algum. No entanto, fato que um pesquisador no est
totalmente livre de conceitos prvios e ideias pr-concebidas, mas ter a conscincia
disto tornou-se relevante para o desempenho da Grouded Theory neste estudo. Em
concordncia com a pesquisadora Mara Bittencourt (2015) acreditamos que:

impossvel que um pesquisador que no seja iniciante consiga entrar


em campo sem pr-noes. Se ao contrrio, reconhecer essa carga de
percepes pode influenciar de forma positiva. tambm o que
reafirma Dey (1999): H uma diferena entre uma mente aberta e uma
cabea vazia. (BITTENCOURT, 2015, p. 7).

Com o olhar da Grouded Theory a pesquisa no blog Estado Dados foi iniciada, mas
antes de detalh-la, so importantes algumas especificaes da GT como metodologia
e mtodo de pesquisa.

Grounded Theory ou Teoria Fundamentada



Caractersticas

A Grounded Theory (GT) uma metodologia, um modo de pensar, de construir a
realidade social, ao mesmo tempo, em que um mtodo com um conjunto de
procedimentos e instrumentos para trabalhar os dados da pesquisa emprica, capaz de

136

Captulo IV

gerar de forma sistematizada uma teoria fundada nos dados183 (TAROZZI, 2011;
GLASSER & STRAUSS, 1967; COHEN et al, 2007). As inquietaes, na maioria das
vezes, brotam do campo, da prtica e das observaes no ambiente digital. O xito
de uma pesquisa conduzida com a GT uma teoria, uma interpretao racional,
densa, articulada e sistemtica, capaz de dar conta da realidade estudada (TAROZZI,
2011, p. 19), com uma slida base emprica. Alguns traos metodolgicos so
fundamentais para caracterizar as pesquisas na GT, so eles (Ibidem, 2011, p. 19-27):

a) Explorao de um processo a GT busca a explorao no de fenmenos, mas


das dinmicas percebidas em contextos. Visa a emerso dos processos sociais e
psicolgicos de base que subjazem aos fenmenos indagados;
b) Amostragem terica na GT a amostra no se forma a priori, mas no decorrer da
pesquisa, buscando as lacunas da teoria emergente;
c) Simultaneidade entre recolher e analisar dados na GT o momento de recolher e
de analisar os dados coincide. Ela exige um acompanhamento constante da
reflexo analtica com peridicos retornos ao campo;
d) Constante comparao a GT leva constantemente perguntas aos dados, nos
vrios nveis de anlise. Essas perguntas buscam nexos entre dados e conceitos
favorecendo o progresso da compreenso conceitual dos fenmenos estudados;
e) Codificao a partir dos dados a GT tem um forte enraizamento da
conceituao com dados empricos, no sendo fruto de nenhuma especulao
filosfica;
f) Elaborao de conceitos a GT visa a elaborao de conceitos e no somente a
descrio dos fatos;
g) Produo de memorandos e de diagramas na GT so feitos memorandos, onde
escrita a histria terica do processo analtico; onde traado o mapa do percurso
desenvolvido e identificadas as direes a assumir no futuro.

Codificao e anlise

A GT se concentra em trs momentos progressivos de codificao: categorias


emersas, reflexes desencadeadas e elaborao de teoria coerente. Como j


183
Lembrando que, especificamente neste estudo, no caber a gerao de uma teoria. Nos atentamos apenas aos pressupostos da
GT.

137

Captulo IV

mencionado, neste estudo vamos nos restringir as duas primeiras etapas, uma
vez que a proposta desta dissertao (um estudo iniciante na rea) no a
elaborao de uma teoria. Retomando a GT, a codificao inicial explora
analiticamente os dados, abrindo-os a todas as direes de sentido possveis. As
reflexes desencadeadas analisam elementos conceituais comuns subjacentes a
pores esboando as categorias e, posteriormente, reunindo-as em macrocategorias.
A terceira o momento de construo da teoria. Quando as categorias esto maduras,
evidenciam-se os nexos que as interligam e, sobretudo, so integradas dentro de uma
teoria coerente e unitria. (...) a codificao, em todas as fases, um processo de
imerso, e o momento de abandonar o plano descritivo para entrar naquele conceitual
(...). (TAROZZI, 2011, P. 135).

Deve-se a partir da imerso nos dados identificar macrocategorias, interligar


categorias entre si e definir suas propriedades. A codificao in vivo visa utilizar as
mesmas palavras dos participantes para dar nome aos conceitos. A codificao terica
visa uma core category (conceito-chave da GT), uma categoria central que organiza
o conjunto das categorias. (...) encontrar e aprofundar (ou as) a core category (ies)
o objetivo da codificao terica, a fase de codificao que se desenvolve no nvel
mximo de abstrao conceitual (TAROZZI, 2011, P. 140). Deve-se:

(...) analisar as relaes entre as categorias e conceituar a tipologia de


relao que as une; desenvolver (dedutivamente e no indutivamente) as
categorias com as subcategorias com base nas propriedades e nas
dimenses de cada uma; colocar as categorias em relao hierrquica,
identificando macrocategorias que compreendem categorias menores.
(TAROZZI, 2011, P. 143).

Escrever uma GT um processo de teorizao. Deve partir de uma reviso dos


memorandos, dos diagramas que integram a teoria, e da reviso bibliogrfica, a
comparao entre os estudos presentes na literatura. As quatro caractersticas
fundamentais da GT podem ser base para a avaliao do trabalho: ser adequada,
relevante, funcionar e ser modificvel.

Avaliando uma Grounded Theory



Cada pesquisa que aborda a Grounded Theory apresenta suas peculiaridades, mas
existem elementos que podem ser levados em considerao na hora de avaliar um

138

Captulo IV

estudo. So eles: amostragem terica; percurso do processo; integrao da teoria;


profundidade; relevncia; utilidade.

- Amostragem terica: como foi selecionada a amostra? Como procedeu a


amostragem terica? Os dados so suficientes para sustentar as inferncias
produzidas?

- Percurso do processo: as categorias foram geradas empiricamente? Pode-se


repercorrer o processo de gerao das categorias? possvel voltar aos principais
eventos que indicaram as categorias? Existem laos slidos (lgicos) entre a anlise
conduzida e os dados coletados? As evidencias empricas so suficientes para
consentir ao leitor compartilhar a anlise?

- Integrao da teoria: os conceitos so sistematicamente interligados? As categorias


so adequadamente desenvolvidas? Como e por que foi selecionada a categoria
fundamental? Com base em quais razes?

- Profundidade: a teoria gerada d conta do fenmeno estudado em sua totalidade?


Foram revelados exclusivamente aspectos marginais e significados bvios? Os
resultados so ligados ao debate cientfico atual sobre o tema?
- Relevncia: as categorias e o processo apresentado abrem novas perspectivas? So
significativos? Desafiam o saber consolidado sobre o tema? So conceitualmente
densos? Tem um fonte poder explicativo? A teoria e os conceitos apresentados duram
no tempo? Abrem ulteriores pesquisas?

- Utilidade: a teoria tem sentido para os participantes? Oferece interpretaes


aplicveis pelos operadores? Intercepta questes relevantes no debate profissional?
Surge pistas para mudanas e inovao?

De posse desses pressupostos da Grounded Theory partimos para a explanao de


como se deu a aplicao no nosso objeto de estudo.

139

Captulo IV

Aplicando a Grounded Theory no blog Estado Dados

Trs instrumentos foram de suma importncia no fazer desta pesquisa e que na GT


assumem caractersticas particulares:

Observao netnogrfica focalizamos imediatamente na observao dos


fenmenos e, sobretudo, dos elementos de processo definidos na pergunta de
pesquisa, dando em um primeiro momento, menor peso descrio do
contexto;
Entrevista depois da entrevista escrevemos rapidamente notas de campo. E
neste estudo, optou-se por no grav-las j que foram feitos acompanhamentos
mais longos dentro da redao do jornal no Blog Estado Dados;
Documentos e anlises de texto foram teis para o confronto com os dados
de campo. J havamos feito fichamentos de dezenas estudos ao longo dos
primeiros 15 meses de pesquisa.

Acompanhamento do blog

Apesar de observar desde 2013 o Blog, o acompanhamento mais sistemtico


aconteceu de janeiro a dezembro de 2015.

Entrevistas semi-estruturadas

Para a melhor compreenso do cenrio da prtica de visualizao de dados foram


feitas entrevistas em profundidade com jornalistas e demais profissionais indicados
pelo jornal O Estado de S. Paulo. O objetivo foi captar qualitativamente as mltiplas
vozes dos envolvidos no cotidiano desta prtica. Para Jensen e Jankowski, os
enfoques qualitativos examinam a produo de significado como um processo, que se
contextualiza e se integra com as mais amplas prticas sociais e culturais (JENSEN
& JANKOWSKI, 1993, p. 13). tanto uma ferramenta quanto um objeto de anlise.

Ao comunicar-se por meio da linguagem, o entrevistador e o entrevistado


negociam um certo conhecimento da matria em questo que, mais tarde,

140

Captulo IV

em forma de transcries, se converte em objeto de anlise lingstica e de


interpretao textual (JENSEN & JANKOWSKI, 1993, p. 44).

De acordo com o pesquisador Michel Thiollent (1980) uma estratgia metodolgica


no nos possibilita abarcar toda a realidade. As verdades so construdas e parciais e
esto relacionadas com os aspectos terico-metodolgicos de uma pesquisa, ou seja,
falsa a neutralidade das enquetes sociolgicas. A utilizao de uma tcnica de
pesquisa envolve limitaes aspectos favorveis e desfavorveis. A opo de
realizar a entrevista em profundidade se deu pela facilidade de entrar em contato e
entrevistar as pessoas envolvidas no cotidiano da redao e por permitir uma relao
de confiana entre pesquisador-pesquisado. As entrevistas foram realizadas a partir de
questes semi-estruturadas que tiveram por objetivo saber:

1) formao profissional: qual a formao dos envolvidos nos projetos em


visualizao de dados; como chegou a trabalhar com dados e jornalismo; com quais
ferramentas de visualizao trabalha e como aprendeu a us-las;

2) construo noticiosa: como geralmente acontece a captura dos dados; quais as


fontes utilizadas; como os dados so agrupados; quais as ferramentas utilizadas no
veculo em que trabalha e como se chega aos assuntos abordados;

3) investimentos: quais os investimentos da instituio na rea em recursos


tecnolgicos, contratao de mo-de-obra e qualificao profissional;

4) dificuldade em lidar com dados: quais as principais dificuldades.

Caminhos de estruturao

No prximo captulo ser apresentada a estruturao j contextualizada aos dados.


Ser o momento de construo, reviso, desconstruo, retorno ao campo, busca de
lacunas descobertas. At encontrar a core category, a categoria central onde todas as
outras categorias devem estar ligadas. De acordo com o socilogo americano Barney
Glaser, um dos fundadores da Grounded Theory, preciso integrar as categorias

141

Captulo IV

dando ateno para as causa, os contexto, a contingncia, as consequncias, as


covariveis e as condies. Esse modelo de estrutura era defendido com bastante
rigidez pelo autor, quando de sua publicao, mas o entendimento atual que so
pistas que daro um bom sustento para esta, sendo possvel trabalhar tambm com
outras questes (BITTENCOURT, 2015, p. 11). Entre os pontos que visamos
aprofundar esto:

a) Delimitaes e categorias emersas: quais peas jornalsticas sero analisadas, por


quais aspectos e porqu. Tendo em mente a percepo macro (do Blog como um
todo184) e micro (no que diz respeito as peculiaridades da prtica) no ambiente
redacional. Primeiramente o Blog Estado Dados, posteriormente os exemplos das
peas jornalsticas Basmetro e Farra do Fies; o cenrio em que nosso objeto de
estudo est inserido; quais as influncias internas e externas do fazer;

b) Reflexes desencadeadas: pontos jornalsticos destacados e desafios do novo;

c) Sustentao terica vinculada a core category: dilogo entre as teorias emergentes


destacadas na pesquisa e o objeto de estudo.

Os dados coletados neste estudo so frutos de visitas a redao do jornal o Estado de


S. Paulo, especificamente ao blog Estado Dados e ao Acervo (setor que responde
pelo armazenamento de contedos do jornal), onde optamos por no gravar as
conversas, mas sim nos aproximarmos das fontes da pesquisa, como apontado na
pgina 140. Alm das conversas presencialmente, foram tiradas dvidas por email e
telefone com os coordenadores dos dois setores, respectivamente, os jornalistas Jos
Roberto de Toledo e Edmundo Leite. Os esclarecimentos presenciais foram feitos
tambm pelos jornalistas Daniel Bramatti e Rodrigo Burgarelli e pelo cientista de
dados Guilherme Duarte. Complementaram os estudos anotaes e bate-papos, em
mini-cursos e congressos, com jornalistas que fizeram parte do Blog ou que
compreendem a execuo de etapas como minerao, extrao, converso de dados e


184
No vamos abordar a histria do jornal do qual o blog faz parte, pois demandaria tempo e no o objeto do nosso estudo. Para
isto h farta referencia bibliogrfica uma vez que falamos de um veculo tradicional e o mais antigo em circulao na cidade de
So Paulo. Informaes complementares encontram-se disponveis no site do veculo em:
http://www.estadao.com.br/historico/resumo/conti1.htm. Acesso em 23 de fevereiro de 2016.

142

Captulo IV

acessos a bases de dados pblicas. Os nomes e eventos so citados ao longo do


prximo captulo em notas de roda p.

Consideraes

Este quarto captulo sintetizou as dificuldades dos estudos em Comunicao na


contemporaneidade e o olhar que damos aos fenmenos neste contexto. Um olhar que
tem a comunicao como centro, que perpassa todas as atividades comunicativas e
informativas de forma transversal, sejam elas analgicas ou no. Um olhar que requer
resilincias diante das abordagens terico-metodolgicas para que as mesmas
consigam abarcar e sustentar as reflexes referentes ao dinmico campo de estudos.
Elementos que justificam nossas escolhas metodolgicas que envolve cruzamentos de
distintos caminhos informativos: pesquisa bibliogrfica, observao no-participante,
estudo de caso, fundamentos da Grounded Theory, cursos, disciplinas, grupo de
pesquisa Com+, palestras, estgio de um ano na disciplina Jornalismo on-line,
momentos que foram descritos anteriormente.

Temos por meta compreender a formao dos profissionais envolvidos (como chegou
a trabalhar com dados e jornalismo; com quais ferramentas de visualizao trabalha e
como aprendeu a us-las); como se do as construes noticiosas (captura dos dados,
fontes utilizadas, como os dados so agrupados, quais as ferramentas utilizadas); os
investimentos na rea (em recursos tecnolgicos, contratao de mo-de-obra,
qualificao profissional) e saber das dificuldades cotidianas em lidar com dados.
Para a partir destas consideraes aprofundar a discusso na busca: de delimitaes e
categorias emersas (percepes macro e micro no ambiente redacional); de reflexes
desencadeadas (pontos jornalsticos destacados e desafios do novo) e da elaborao de
uma sustentao terica vinculada a core category, com o dilogo entre as teorias
emergentes destacadas na pesquisa e no objeto de estudo.

O captulo V, portanto, faz uma inverso, onde diante dos dados as teorias so
questionadas. O captulo tem por objetivo exemplificar a prtica da visualizao de
dados a partir dos contedos trabalhados no blog Estado Dados e a meta de agrupar
elementos que ajudem a responder a pergunta problema desta pesquisa: O que a

143

Captulo IV

visualizao de dados no jornalismo? Como ela se insere na prtica e na narrativa do


jornalismo de dados proporcionando diferenciais relevantes?

144

Captulo V

V. BLOG ESTADO DADOS

Resumo: Este captulo tem por objetivo exemplificar a prtica da visualizao de


dados a partir dos contedos trabalhados no blog Estado Dados. Parte-se de uma
descrio geral do blog e peculiaridades de cada seo, para em seguida abordar os
processos includos nas peas jornalsticas.

Palavras-chave: Blog Estado Dados; ferramenta de visualizao; Jornalismo de


Dados

Lindando com os dados

Houve um tempo em que, para se saber o voto de cada deputado em


relao a um determinado projeto, era preciso comparecer a uma salinha
localizada abaixo do plenrio da Cmara, entrar em uma fila e solicitar ao
atendente um relatrio emitido pelo painel eletrnico. L funcionava uma
nica impressora matricial, cuja cabea golpeava com agulhas uma fita
impregnada de tinta, marcando no papel pontos em linhas horizontais que,
aps alguns milhares de vaivns, desenhavam 513 nomes, siglas
partidrias e, ao lado, os registros de sim, no absteno e ausente
(BRAMATTI, 2014, p. 219).

De acordo com o relato do jornalista Daniel Bramatti (acima) perceptvel a


dificuldade de correlacionar as informaes e se fazer uma anlise do comportamento
dos parlamentares e das bancadas. O depoimento no de um passado distante, mas
dos primeiros anos do governo Fernando Henrique Cardoso (que esteve a frente da
presidncia do pas entre 1o de janeiro de 1995 e 1o de janeiro de 2003), onde
houveram alteraes da Constituio como a quebra do monoplio estatal do petrleo
e da privatizao das telecomunicaes. Com a digitalizao, estes dados passaram a
ser disponveis em arquivos de texto ou de banco de dados, mas como a composio
dos presentes variava a cada votao, nenhuma lista era igual outra, o que, mais
uma vez, praticamente inviabilizava a anlise de sries histricas (BRAMATTI,
2014, p. 220). O panorama s comeou a mudar de forma significativa uma dcada

145

Captulo V

depois, quando o movimento pela publicao de dados abertos deu seus primeiros
passos no Congresso.

Hoje, com a comunicao em rede e o manuseio de grandes volumes de dados, as


informaes so passveis de serem agrupadas e conversveis entre si com maior
facilidade. Isto no quer dizer que seja uma tarefa fcil. Requer habilidades, mas
possvel. Como exemplo, h a construo de ferramentas de visualizao como o
Basmetro185 (citado brevemente no captulo II), que estreou em maio de 2012,
juntamente com o blog Estado Dados, do Jornal O Estado de S. Paulo. Foi a primeira
ferramenta criada pelo grupo, originria do primeiro ncleo de jornalismo de uma
consolidada redao no Brasil. Nasceu sob a coordenao do jornalista, especialista
em poltica, Jos Roberto de Toledo, que atualmente tambm diretor da Abraji.

Os passos deste estudo nos levaram por dois caminhos. Em um primeiro momento:
uma abordagem macro onde buscamos compreender as dinmicas do trabalho da
visualizao de dados dentro da redao. Uma atividade que possui um ciclo de
produo e consumo prprios. Mas, como o objetivo desta pesquisa era ir alm,
encontrar outras nuances que remetem ao que a visualizao de dados no
jornalismo, achamos importante destacar o trabalho desenvolvido pelos jornalistas do
Blog a partir de um outro prisma, aproximando o olhar. O segundo caminho, portanto,
foi aprofundar as discusses de forma mais sistemtica a partir de dois exemplos:

- do prprio Basmetro por ser uma ferramenta em visualizao disponibilizada para


o acesso do pblico e pela sua importncia por coincidir com a estreia do blog
Estado Dados;

- e da srie de reportagens Farra do Fies186, por envolver a formao de uma base de


dados prpria (originria do cruzamento de outros bancos de dados) para a produo
de contedos relacionados ao financiamento do ensino superior no pas e pelos
desdobramentos que esta srie de reportagens obteve.


185
Aprofundaremos a discusso sobre o Basmetro ao longo deste captulo.
186
http://blog.estadaodados.com/?s=fies

146

Captulo V

A partir deste novo afunilamento visamos encontrar elementos para nos auxiliar a
sustentar as respostas desta pesquisa.

Blog Estado Dados

O blog Estado Dados tem um ncleo estruturado e autnomo dentro da redao do


Jornal O Estado de S. Paulo. especializado em reportagens baseadas em estatsticas
e no desenvolvimento de projetos especiais de visualizao de dados. No Blog so
observados grficos e animaes sobre temas cotidianos, alm de anlises especiais
feitas a partir do cruzamentos de dados. A equipe, atualmente, formada por
jornalistas e programadores, onde atuam diretamente os profissionais: Jos Roberto de
Toledo coordenador do Blog; Rodrigo Burgarelli - reprter e analista de dados;
Guilherme Duarte cientista de dados e Daniel Bramatti - reprter.

Figura V. 15 Estadaodados.com, home do dia 14 de dezembro de 2015.


Fonte: http://blog.estadaodados.com/

147

Captulo V

So diversas as frentes de trabalho desenvolvidas. No Blog encontram-se as sees


Grfico do Dia, Permanentes, Sries, Eleies, 96xSP e Projetos Especiais. Alm dos
espaos para comentrios, compartilhamento via redes sociais e links para posts
similares, que levam para as diversas editorias que repercutiram os contedos
publicados. As sees se destinam a:

Grfico do Dia trazer notcias cotidianas, com diversas temticas, mas


principalmente polticas;
Permanentes incluir trabalhos atemporais, estatsticas que so constantemente
atualizadas;
Sries diversos contedos que focam em um tema especfico, so mais
aprofundados e com usos de recursos mais complexos;
Eleies publicaes referentes a cobertura das eleies de 2014;
96xSP matrias que abordam as caractersticas dos 96 distritos paulistanos,
segundo o Censo 2010;
Projetos Especiais trabalhos mais complexos que utilizam, muitas vezes,
ferramentas de visualizao.

A produo no tem a obrigatoriedade de ser diria, mesmo na seo denominada


Grfico do Dia. Em coleta feita em setembro de 2015, por exemplo, somente esta
seo estava com atualizao no mesmo ano. Isso no quer dizer que o contedo seja
defasado, apenas que h outra lgica que rege a produo especfica destas peas
jornalsticas que no a produo diria, como estamos acostumados a ver nos veculos
tradicionais de mdia (retomaremos este assunto mais a frente). Em coleta feita no dia
03 de setembro de 2015:

Grfico do Dia haviam 9 pginas, 8 delas com 20 grficos e uma com 3. Total
de 163 trabalhos;
Permanentes haviam duas pginas, uma 1 com 20 e outra com 4 matrias. Total
de 24 peas;
Sries haviam 3 pginas, 2 com 20 e uma com 8 matrias. Total de 48 peas;
Eleies haviam 8 matrias;
96xSP eram 2 pginas, uma com 20 e outra com 5 matrias. Total de 25 peas;

148

Captulo V

Projetos Especiais encontravam-se 12 projetos.

Em nova observao feita no Blog em 2016, apenas a seo Grficos do Dia teve
alterao no nmero de matrias, subindo de 163, em setembro de 2015, para 168 em
18 de fevereiro de 2016. As demais encontravam-se sem novas publicaes. Diante
desta breve apresentao do Blog, vamos a sua histria que coincide com a criao da
ferramenta Basmetro.

Basmetro

O Basmetro analisa a taxa de governismo187 dos polticos da Cmara Federal e do


Senado atravs dos dados das votaes realizadas nas casas, podendo consultar a
proposio dos votos desde 2003. No um infogrfico, no um banco de dados,
no uma tabela, mas tudo isso ao mesmo tempo (BOUNEGRU et.al, 2012, p.
102), definiu o livro Data Journalism Handbook, na verso em portugus intitulado
Manual de Jornalismo de Dados. Com uma interface intuitiva, o Basmetro permite a
aplicao de filtros e a seleo de perodos de tempo ou votaes especficas, fazendo
assim com que cada um crie um caminho narrativo prprio. Possibilita ao usurio
visualizar quo a favor ou contra certo deputado, senador ou legenda do governo.

O Basmetro organizou centenas de milhares de dados que eram mero


rudo dos sites do Congresso em uma interface grfica que os cientistas
polticos puderam e podem usar para fazer suas anlises. (TOLEDO, 2014,
p. 9)

Na pgina da ferramenta Basmetro h um tutorial de uso para auxiliar na leitura dos


dados, onde podem ser feitas as escolhas de que votaes acompanhar, por exemplo:
no Senado ou na Cmara dos Deputados. Trazendo o recorte das votaes na cmara,
as cores das bolinhas indicam os partidos de cada deputado. Na legenda ao lado
esquerdo aparecem quais as cores de cada partido. Ela funciona tambm como filtro,
quando clicada mostra o comportamento do partido nas votaes. Cada crculo dentro


187
A taxa de governismo a medio do apoio ou no dos deputados ao governo. Por exemplo, a taxa de governismo ser maior
quanto maior for o nmero de votos pr-governo em relao ao total de votos do perodo.

149

Captulo V

do grfico representa um deputado. Clicando ou tocando nestes crculos descobre-se


as votaes do candidato. Sendo possvel ver quantos por cento cada um votou a favor
do governo. Quanto mais pra cima do grfico estiverem as bolinhas, mais governista
foi o candidato. Quanto para baixo, mais oposicionista. possvel restringir a anlise
em um perodo especfico de tempo e fazer inmeras outras exploraes a partir dos
dados disponveis. A evoluo do apoio ao governo ao longo do tempo pode ser feita
acionando a tecla play, no campo inferior direito. Ela mostra a mudana do
comportamento dos deputados e dos partidos ao longo das votaes. Na pgina
possvel acompanhar anlises em vdeo j feitas pela equipe, como a do ncleo duro
de Dilma, daqueles que votaram de acordo com a orientao do lder do governo em
90% dos casos ou mais vezes.

Figura V. 16 Usabilidade da ferramenta Basmetro taxa de governismo de candidato do PSC/PB

Fonte: estadaodados.com/basometro, 2016

Agora, como comeou o Basmetro? Em 2011, a Cmara dos Deputados e do Senado


divulgou o projeto Dados Abertos188 onde passou a disponibilizar digitalmente dados

188
http://dados.gov.br/

150

Captulo V

legislativos permitindo conhecimento, apropriao e reutilizao das informaes por


outros rgos pblicos, entidades da sociedade civil e demais interessados. E como
aponta Daniel Bramatti, no demorou para que cidados comeassem a manifestar
sua criatividade. Em janeiro de 2012, Leonardo Leite, mestrando em Cincias da
Computao e integrante do PoliGNU, da USP, lanou o projeto Camaraws189
(BRAMATTI, 2014, p. 223). A ideia de criar o Basmetro surgiu exatamente a partir
de um post, no Facebook, que falava sobre este trabalho desenvolvido no laboratrio
da Escola Politcnica, da Universidade de So Paulo. Era uma ferramenta de
visualizao que trazia dados de votao, que mostrava a direita e a esquerda
governista do pas.

Graas ao novo formato de publicao do projeto Dados Abertos, Leonardo Leite


pde agregar dados de vrias votaes e consolid-los segundo diferentes critrios
por partido, por estado, etc. Em seguida comparou o comportamento dos partidos,
dois a dois, para revelar o ndice de semelhana entre eles. Quando tomou
conhecimento sobre o Camaraws, o jornalista poltico Jos Roberto de Toledo entrou
em contato com a equipe da PoliGNU para fazer algo em conjunto. Seria um bom
desafio para iniciar as atividades do blog Estado Dados que j estava em formao.

Os desdobramentos do fazer

No caso do Basmetro, primeiramente foi preciso conhecimento em programao


para a anlise de grandes quantidades de dados que no so suportados por, exemplo,
em programas como Excel que possui um limite do que consegue analisar. A Cmara
e o Senado, diante da poltica de dados abertos, j disponibilizava via APIs os votos
dos parlamentares na linguagem Python. O Basmetro focou nesta mesma linguagem
(que de alto nvel) para a raspagem dos dados e em JavaScript (que roda em cdigos
HTML) para gerar os grficos e manter a interatividade da ferramenta assumindo o
papel humanamente impossvel de analisar todos os votos e chegar a resultados
passveis de compreenso.


189
O ws do nome Camaraws vem de web services. O projeto foi rebatizado, posteriormente, para Radar Parlamentar e est
disponvel no endereo: http://radarparlamentar.polignu.org/. Acesso em 6 de fevereiro de 2016.

151

Captulo V

A programao esteve presente em todo o processo informacional, na apurao, na


produo e na apresentao dos dados. No entanto, os profissionais envolvidos foram
os definidores das variveis destacadas para a anlise de cada situao. Foi um
trabalho intenso, que passou por diversas releituras, inclusive da fuga da militncia
poltica. Foram adotadas as nomenclaturas governo e oposio. Foram alimentados os
votos de deputado a deputado e de senador a senador, disse Toledo190.

Foram consideradas todas as votaes nominais, as nicas em que o voto


individual computado, que ocorreram desde o incio de 2011. No caso da
Cmara, no entraram no levantamento os casos em que o governo no
orientou os deputados sobre como votar. No Senado, foi usado como
referncia o voto do lder do governo na Casa (ESTADO DADOS,
2012)191.

Na sua estreia, o software da ferramenta foi adaptado para absorver dados sobre 825
votaes e cerca de 420 mil votos na Cmara nos dois mandatos do presidente Luiz
Incio Lula da Silva. S preciso fazer uma vez o cdigo, depois s repetir ou
alterar as variveis. Foram discutidas as bases, em escalas de 0 a 100 e definido que o
cdigo seria aberto, complementou Toledo.

Os jornalistas Bruno Lupion e Amanda Rossi organizaram, posteriormente, uma base


de dados com todas as votaes da Cmara e do Senado no governo Dilma Rousseff
com a posio de cada parlamentar em relao orientao do lder do governo.
Paralelamente a isso, o programador e designer Carlos Lemos construiu um software
para processar estes dados. Como o objetivo era permitir que os usurios fizessem
diversas correlaes e leituras dos dados, a arquitetura, desde o princpio, levou em
considerao a interatividade e uma interface que possibilitasse ao usurio analisar o
comportamento de indivduos, partidos e bancadas estaduais em votaes isoladas ou
em qualquer perodo do governo Dilma. Com isto, o Basmetro possibilitou inmeras
informaes at ento inditas.

(...) Reportagens revelaram que o ncleo duro de Dilma formado por


parlamentares que votavam com o governo em 90% das vezes ou mais
havia encolhido no segundo ano do mandato, e que o PMDB era o
principal responsvel pela disperso da base aliada. (...) O Basmetro
tambm permitiu ver quais eram os deputados e senadores

190
Em visita a redao de O Estado em 17 de novembro de 2015.
191
Reportagem de O Estado de S. Paulo, intitulada Ferramenta mede taxa de governismo de deputados. Publicada em 13 de
maio de 2012. Disponvel em: http://politica.estadao.com.br/noticias/eleicoes,ferramenta-mede-taxa-de-governismo-de-
deputados-imp-,872318. Acesso em 6 de dezembro de 2015.

152

Captulo V

independentes, que assumiam posies divergentes das de seus partidos.


(BRAMATTI, 2014, p. 225).

O Basmetro encontra-se na seo Permanentes do blog Estado Dados e foi o tema


do livro Anlise poltica & jornalismo de dados, sob a organizao do doutor em
cincia poltica pela USP, Humberto Dantas, pelo jornalista e coordenador do blog
Estado Dados Jos Roberto de Toledo e pelo doutor em cincias sociais da PUC-SP
Marco Antnio Carvalho Teixeira. O livro, de 2014, reuniu cientistas polticos e
jornalistas para discutir hipteses do cenrio da poltica nacional. Aps o
conhecimento sobre este projeto, vamos a outro exemplo, que no resultou em uma
ferramenta, mas onde foi consolidado um banco de dados para a construo de uma
srie de reportagens-denncia.

Farra do Fies

Publicada em fevereiro de 2015, a reportagem Farra do Fies192 investigou os gastos do


governo federal com o Financiamento Estudantil (FIES). Ela mostrou que o
investimento federal no programa aumentou 13 vezes entre 2010 e 2014. No entanto,
tambm apontou que caiu o ritmo do crescimento de matrculas nas faculdades
particulares. A mdia anual passou de 5% entre 2003 e 2009, para 3% de 2010 at
2013. O trabalho mostrou ainda que subiram as transferncias de recursos da Unio
para grupos de educao aps alteraes nas regras do Fies. Em 2010, no havia
nenhuma empresa de educao entre as 70 que mais recebiam do governo federal. J
em 2014, sete constavam na lista.

Paulo Saldaa, Rodrigo Burgarelli e Jos Roberto de Toledo conquistaram a categoria


principal da 60a edio do ExxonMobil 2015 (antigo Prmio Esso de Jornalismo) com
reportagem a Farra do Fies. A comisso responsvel pelo prmio destacou o fato de o
especial trazer, alm de entrevistas e anlises de documentos, o cruzamento de
grandes bancos de dados, como o do Censo de Educao Superior e o do Portal de
Transparncia, alm de registros de mais de 300 instituies de ensino do pas. O
esforo revelou, entre outros aspectos at ento ocultos, que o programa consumiu R$


192
http://blog.estadaodados.com/?s=fies

153

Captulo V

28 bilhes em quatro anos, endividando alunos que dificilmente tero condies de


ressarcir os cofres pblicos, apontou o anncio da premiao193.

O Fies foi criado em 1999 para emprestar dinheiro para alunos cursarem faculdades
particulares. Com o intuito de aumentar o nmero de alunos, em 2010 houveram
mudanas nos contratos onde os juros caram de 6,5% para 3,4% ao ano, valor este
abaixo da inflao na poca. Alm disso, o financiamento pde ser obtido a qualquer
momento, foi relaxada a exigncia de fiador e o prazo de quitao foi prolongado.
Com estas medidas o Fies teve uma exploso de contratos. A principal consequncia
das novas regras foi o crescimento nas transferncias de alunos particulares para
alunos Fies nos grupos de educao.

O Kroton-Anhanguera, por exemplo, foi a empresa que mais recebeu


pagamentos do governo federal em 2014. Doze mantenedoras do grupo
receberam juntas mais de R$ 2 bilhes - o dobro do que a Embraer, que
fabrica avies militares, e a Odebrecht, responsvel por dezenas de obras
pelo pas (TOLEDO et al. 2015)194.

O nmero de alunos no Fies subiu 448%, ou seja, de 150 mil, em 2010, para 827 mil
em 2013, ltimo ano em que h dados do Ministrio da Educao. No entanto, o total
de alunos na rede privada subiu apenas 13% - de 3,9 milhes para 4,4 milhes. A
explicao que muitas faculdades passaram a incentivar alunos j matriculados a
no pagar a prpria mensalidade, mas a entrar no Fies que, por sua vez, repassa os
valores diretamente para as instituies, sem atraso ou inadimplncia (TOLEDO et
al. 2015).

Sete infogrficos interativos foram desenvolvidos para explicar a farra do


financiamento estudantil e encontram-se disponveis para consulta no blog Estado
Dados. Na sequncia, vamos aos desdobramentos de como se chegou a srie de
reportagens Farra do Fies.


193
Reportagem Pelo segundo ano consecutivo, Estado vence principal premio de jornalismo do pas, publicada pelo jornal
O Estado de S. Paulo em 19 de outubro de 2015. Disponvel em: http://politica.estadao.com.br/noticias/geral,pelo-segundo-ano-
consecutivo--estado-vence-o-principal-premio-de-jornalismo-no-brasil,1782259. Acesso em 20 de dezembro de 2015.
194
Reportagem Gasto com o Fies cresce 13 vezes e chega a R$ 13,4 bi, mas ritmo de matrculas cai, publicada pelo jornal O
Estado de S. Paulo, em 15 de fevereiro de 2015. Disponvel em: http://sao-paulo.estadao.com.br/noticias/geral,gasto-com-fies-
cresce-13-vezes-e-chega-a-r-13-4-bi-mas-ritmo-de-matriculas-cai-imp-,1634714. Acesso em 20 de dezembro de 2015.

154

Captulo V

Figura V. 17 Srie de infogrficos interativos explicam financiamento estudantil

155

Captulo V

156

Captulo V

157

Captulo V


Fonte: http://blog.estadaodados.com/?s=FIES, 2015

Os desdobramentos do fazer

De acordo com Jos Roberto de Toledo, a pauta sobre o Fies surgiu ao acaso, quando
ele observava os dados do Portal de Transparncia195, do Governo Federal, e achou
curioso o fato de entre as empresas que receberam mais dinheiro pblico se
encontrarem instituies de ensino privadas. Por que isto? Por que estas instituies
em especial? Por que estes valores? O faro jornalstico indicou que poderia haver uma
pauta naquela primeira informao. A partir da a indagao foi encaminhada para o
jornalista Rodrigo Burgarelli que foi levantar os valores: quando a instituio
comeou a receber e qual a trajetria de recebimento ao longo dos anos. Iniciou-se o
processo de pergunta aos dados. Por que, a partir de 2010, h um enorme crescimento
nestes valores? O que aconteceu? Neste momento, o jornalista Paulo Saldaa, editor
de Educao do jornal O Estado de S. Paulo, trouxe os esclarecimentos que faltavam
sobre a mudana das regras. Agora era seguir pois havia sim uma pauta. A equipe do


195
http://www.portaltransparencia.gov.br/

158

Captulo V

Estado Dados, especialmente o Rodrigo Burgarelli, precisou primeiramente escrever


em cdigo, para da escrever a matria na lngua portuguesa.

Entrevistamos milhes de registros do Oramento Geral da Unio e do


Censo da Educao Superior. Aos dados se juntaram as histrias de alunos
e escolas, to bem apuradas e contadas por Paulo Saldaa. Sem a juno da
tcnica com o conhecimento, sem combinar a anlise estatstica com a
experincia profunda em educao, a Farra do Fies no existiria, afirmou.
(TOLEDO apud THOM, 2015)196

Em entrevista no dia 1o de maro de 2016, Toledo comentou sobre os procedimentos


adotados no desdobramento da reportagem, sobre como foi elaborada a base de dados
e suas correlaes. Em suas palavras foi perceptvel a presena de cinco momentos na
construo do sistema narrativo (TOLEDO, 2016):

1o) No uma s, mas apareceram vrias empresas educacionais. O que era uma
anomalia. Quase a totalidade dos cursos era do Fies. A partir da capturamos os dados
do Portal de Transparncia. No sei dizer se foi exatamente uma lista ou qual formato.
Conseguimos alguns dados e comeamos a trabalhar num banco de dados em
MySQL197. Fizemos a correlao dos dados, quem tinha recebido, quanto.

2o) Saldaa fez uma correlao com uma outra base de dados do MEC, para ver
quais nomes de empresas pertenciam a um mesmo grupo. Da fizemos uma agregao
de dados e fomos vendo quais instituies eram as maiores recebedoras. Com base
nisso conseguimos fazer um ranking.

3o) Capturamos a base do Fies para ver quantos alunos tinham o financiamento.
Calculamos a taxa de cada uma delas. Conseguimos ver o acrscimo significativo.

4o) Captamos uma outra base do Censo do Ensino Superior, do MEC. Fizemos uma
anlise para ver a evoluo do nmero de matrculas no ensino superior pra constatar
que no havia nenhum acrscimo significativo no nmero de alunos em decorrncia
do Fies. Ele estava praticamente estvel.

196
Reportagem Jornalistas do Estado recebem no Rio prmio Esso de jornalismo. Publicada no dia 13 de novembro de 2015.
Disponvel em: http://politica.estadao.com.br/noticias/geral,jornalistas-do-estado-recebem-no-rio-premio-esso-de-
jornalismo,10000001888. Acesso em 20 de dezembro de 2015.
197
O MySQL um sistema de gerenciamento de banco de dados (SGBD), que utiliza a linguagem SQL (Linguagem de Consulta
Estruturada, do ingls Structured Query Language) como interface. atualmente um dos bancos de dados mais populares, com
mais de 10 milhes de instalaes pelo mundo. Disponvel em: https://pt.wikipedia.org/wiki/MySQL. Acesso em 07 de maro de
2016.

159

Captulo V

5o) Fizemos uma outra base para ver o preo mdio de mensalidades pra mostrar que
vinham caindo e voltou a crescer a partir do Fies. Foram junes de bases de dados.
Chegamos aos resultados que explodem gastos frente ao Fies por parte do governo,
mas que existem os mesmos nmero de alunos.

A equipe esteve envolvida na construo e correlao das bases de dados por


aproximadamente dois meses e meio. As reportagens foram publicadas no decorrer de
nove dias, por conta do nmero de informaes e desdobramentos gerados. Diante de
uma viso mais prxima dos processos de execuo do Basmetro e da Farra do Fies,
tendo os dados coletados nas conversas, entrevistas com a equipe do Blog e a
investigao sobre o assunto que aconteceu ao longo da realizao do mestrado,
iniciamos as reflexes sobre a visualizao de dados e o jornalismo de dados a partir
das informaes obtidas. O objetivo posterior ser o de discut-las juntamente com as
referncias bibliogrficas adotadas na pesquisa.

Reflexes desencadeadas

O caminho para chegar ao blog Estado Dados vem do acompanhamento desde 2013
dos contedos em visualizao de dados em mbito nacional e internacional. Como j
mencionado no captulo anterior, foram inmeras buscas on-line, palestras,
participao em MOOcs na rea, acompanhamento de pesquisas, artigos, livros,
defesas de dissertao que abordaram a temtica. O estudo de caso do Blog se deu por
ele ter tanto contedos grficos, quanto projetos em visualizao, pelas constantes
atualizaes de contedo e por estar em um cenrio brasileiro de investimentos nesta
rea.

O primeiro contato com a equipe do Estado Dados aconteceu a partir das oficinas em
visualizao de dados cursadas no 10o Congresso Internacional de Jornalismo
Investigativo da Abraji, realizado em agosto de 2015, em So Paulo. As visitas
redao foram agendadas via email e logo na primeira algumas percepes surgiram:
o grupo muito pr-ativo e formado por pessoas que gostam, se envolvem e se
dedicam ao que fazem. Os diversos conhecimentos so sempre bem-vindos,

160

Captulo V

indiferentemente da rea, e h inmeras buscas por troca de experincias. Como j


mencionado, as rotinas produtivas so outras.

A produo no tem a obrigatoriedade de ser diria, mas sim de entregar contedos


aprofundados, contextualizados e diferenciados na forma de contar histrias a partir
de grandes bases de dados, de histrias ocultas. uma equipe que tem o
autodidatismo presente e a no-linearidade da escrita em trabalhos que so
essencialmente desenvolvidos em grupo. uma equipe afinada com as tendncias
contemporneas e as demandas do exerccio da profisso num cenrio Big Data. H
uso de grandes bases de dados, busca por tutoriais e exemplos de quem j fez, tendo
como elemento fundante os testes sobre os diferentes caminhos de construes
narrativas.

As visitas posteriores, entrevistas e observaes sistemticas nos levaram aos pontos


jornalsticos que se destacavam e aos desafios de se trabalhar com a visualizao de
dados. Vamos a eles!

Pontos jornalsticos destacados

Alguns pontos tornam-se perceptveis no acompanhamento mais prximo dos


trabalhos desenvolvidos no Blog. No h uma frmula para a execuo dos trabalhos,
cada pea tem suas peculiaridades. Os pontos jornalsticos que destacamos de
imediato foram: finalidade do contedo; testes, adaptaes e autodidatismo; faro
jornalstico e formao da equipe; armazenamento e recuperao de dados
(datalizao); soluo e validao das peas.

Finalidade do contedo

A finalidade de uso do contedo define o design em que o mesmo chegar ao leitor.


Seja uma ferramenta, como o Basmetro, que serve para anlise e consulta na base de
dados ou como infogrficos, estticos ou dinmicos, que selecionam e apresentam de
forma visual o contedo para os leitores. So feitas escolhas na hora da apresentao
dos contedos. Nem tudo ser mostrado, afinal so grandes bases de dados que

161

Captulo V

acabam sendo formadas em cada pea. H visualizaes que funcionaro como base
de dados somente para a prpria equipe e uso em pautas futuras. O leque de opes de
visualizao em uma ferramenta como o Basmetro, por exemplo, maior,
possibilitando que o leitor faa diferentes correlaes diante do banco de dados
disponvel e utilizando-o como fonte, seja para outras reportagens, pesquisas
acadmicas, curiosidade.

A reportagem Farra do Fies um exemplo do resultado da construo de uma base de


dados que reuniu mais de 40 mil linhas de informaes de estudantes, com o
cruzamento de informaes do Censo de Educao Superior, do Portal de
Transparncia do governo federal, alm de registros de mais de 300 instituies de
ensino superior do pas. Esta base de dados no foi integralmente disponibilizada para
o pblico, mas serviu de fonte de consulta para a produo de reportagens do ncleo
do Estado Dados.

A matria Qual partido tem mais deputados com problema na Justia? 198 um
exemplo de infografia que a partir de grficos de barras interativos mostra
primeiramente quais so rus e investigados e, em um segundo momento, qual a
proporo da bancada com problemas na justia. Os dados so do Congresso em
Foco 199 que realizou um levantamento de processos e inquritos que correm no
Supremo Tribunal Federal e envolvem deputados e senadores da atual legislatura.

O material foi disponibilizado para consulta em agosto de 2015 e no mesmo ms,


usando Infogr.am200, parte do contedo foi disponibilizado pela equipe do Estado
Dados. Uma forma de apresentao de um contedo complexo, relevante pela
interligao e possibilidade de cruzamento de dados, de forma visual e que facilitou a
compreenso e leitura por parte do pblico.


198
Disponvel em: http://blog.estadaodados.com/advinhe-qual-partido-tem-mais-deputados-com-problema-na-justica/. Acesso
em 12 de fevereiro de 2016.
199
http://congressoemfoco.uol.com.br/noticias/os-deputados-sob-investigacao-no-supremo/
200
O Infogr.am como se fosse um Adobe Illustrator para a produo rpida e fcil de infogrficos. Ele permite que qualquer
pessoa (dedicada) e com um mnimo de experincia (ou curiosidade para aprender), consiga criar infografias em torno de trs
passos: selecionando um design, adicionando os dados e compartilhando ou incorporando a infografia. Outras informaes em:
https://infogr.am/pt-br

162

Captulo V

Figura V. 18 Grfico interativo traz deputados com problemas na justia.

Fonte: blog.estadaodados.com, 2016

De acordo com Toledo, nem tudo rende uma ferramenta em visualizao. No caso do
Basmetro, por exemplo, faz sentido voc ter uma ferramenta de acompanhamento
permanente pois um filme de algo que continua acontecendo, tem um passado, um
presente, um futuro. uma situao mutante, ao longo do tempo, muda de um dia
para o outro (TOLEDO, 2016, anotaes). J no caso da Farra do Fies, o propsito
era outro, o de narrar uma histria. o que queramos era denunciar, contar uma
historia. Ento no foi necessrio desenvolver uma ferramenta, que algo mais
complicado, cruzar vrias bases de dados, que precisa de uma interpretao diferente
(ibidem, 2016).

Testes, adaptaes e autodidatismo

No cenrio Big Data, o bloquinho, a caneta, o gravador e a cmera, por exemplo,


dividem espao com recursos digitais como Excel, Python, MySQL, etc. Na Internet

163

Captulo V

h muitos dados de instituies onde a escala de investigao maior; dados abertos,


como do Instituto Brasileiro de Geografia e Estatstica (IBGE), da Organizao das
Naes Unidas (ONU), do Banco Mundial, entre muitos outros. No Brasil,
principalmente a partir da Lei de Acesso Informao (LAI), de 2011.

O jornalismo de dados um jeito diferente de apurar. Voc no vai pra rua,


faz fala-povo, usa mtodos mais cientficos. O prazer est em ler tabela,
cheias de nmeros, de dados at tirar concluses (BURGARELLI, 2015,
anotaes).

Como todo o trabalho desenvolvido no Blog experimental, so feitos muitos testes.


Desde o uso de determinados infogrficos em detrimento de outros e at de
navegabilidade. Se as peas conseguem responder as principais perguntas que podem
ir surgindo no decorrer da leitura; se os pontos trabalhados esto claramente
compreensveis. Esta avaliao fica por conta da prpria equipe do Blog com leituras
coletivas do material antes de serem publicados. De acordo com Toledo (2016), nunca
foram feitas mudanas ou melhorias em reportagens publicadas no Blog, apenas
desdobramentos do contedo postado. O que difere, por exemplo, das ferramentas e
dos projetos permanentes. Como so constantes, s vezes so agregadas novas
funcionalidades, melhorias na navegao. Alm da alimentao com novas bases
diante das recentes votaes, como no caso do Basmetro.

A ferramenta Vai Passar201 tambm um exemplo. A proposta visa, a partir de um


lder partidrio, saber qual a chance de um projeto passar na Cmara. A pesquisa
feita com base na votao tendo as opes de maioria simples, maioria absoluta ou
emenda Constituio. Pedimos ajuda do sistema de arte para fazer o designer, mas
toda a programao foi feita por ns prprios, comentou Toledo. O que nos leva a
uma outra questo: ao autodidatismo da equipe.

Os profissionais hoje envolvidos diretamente no Blog tem a caracterstica nata do


autodidatismo. Tem como hbito a leitura de tutoriais e a busca por diferentes formas
de contar histrias. Em vrios trabalhos busca-se o que j foi feito em outros veculos
de grande mdia, principalmente de fora do pas, onde os ncleos de jornalismo de
dados so mais desenvolvidos.


201
Disponvel em: http://estadaodados.com/vai-passar/

164

Captulo V

Figura V. 19 Ferramenta interativa aponta qual a chance de um projeto passar na Cmara

Fonte: blog.estadaodados.com, 2016

Por exemplo, na reportagem Compare o desempenho das selees da Copa em 10


indicadores202 foi feito acompanhamento histrico do campeonato brasileiro inspirado
num grfico que foi publicado nos EUA, pelo estatstico Nate Silver (voltaremos a
falar dele mais a frente), autor do blog FiveThirtyEight e que trabalha na ESPN. A
ideia veio de fora, mas as ferramentas e os cdigos foram desenvolvidos pela equipe
brasileira.


202
http://blog.estadaodados.com/compare-o-desempenho-das-selecoes-da-copa-em-10-indicadores/

165

Captulo V

Figura V. 20 Infogrfico interativo permite comparar o desempenho das selees da Copa

Fonte: blog.estadaodados.com, junho de 2016

Faro jornalstico e formao das equipes

Mesmo trabalhando com nmeros e dominando melhor recursos digitais, o


coordenador Jos Roberto de Toledo aponta que preciso o faro jornalstico. Ele
defende a necessidade de um conjunto de caractersticas que so bsicas de um bom
reprter. No somente curiosidade e pacincia para cruzar informaes e avaliar o que
notcia, mas principalmente no se contentar com o primeiro retorno ao lidar com
dados. Para ele, o faro jornalstico uma das essncias da profisso que no deve
estar presente apenas em jornalistas, mas na equipe como um todo.

(...) a capacidade de ver uma notcia quando se deparar com ela. algo
difcil de se especificar... saber que ali tem uma novidade, uma novidade
de interesse pblico e que voc poderia chamar a ateno das pessoas para
aquele assunto. um conjunto de fatores. Um raciocnio questionador, que
no se deixe levar pelo que os psiclogos chamam de sistema 1,
imediatismo intuitivo, do primeiro contato com as informaes. Pra coisa

166

Captulo V

funcionar voc vai precisar do sistema 2, que mais lento, mas que
consiga colocar em contradio o que v, com as suas prprias referncias,
seu prprio trabalho (TOLEDO, 2016).

Partindo deste depoimento retomamos a questo da integrao da equipe. Da mesma


forma que relevante que jornalistas entendam o bsico em estatstica, bancos
de dados, entre outros. relevante que estatsticos, programadores e designers
entendam fundamentos do jornalismo para que ocorram dilogos, integraes e
melhorias nas peas. Isso tem acontecido na prtica diria, com a formao das
equipes e as demandas cotidianas. Em mbito educacional diversas iniciativas esto
disponveis, entre cursos on-line gratuitos, cursos de curta durao, extenso para que
os interessados possam dar o ponto de partida nas discusses que envolvem
jornalismo de dados, jornalismo investigativo, Big Data, visualizaes.

Em uma breve pesquisa, feita em dezembro de 2014, haviam dezenas de cursos.


Moocs gratuitos como o Doing Journalism With Data, do centro de notcias Data
Drive Journalism203 e o Introduo Visualizao de Dados e Infografia204, que foi
organizado pelo Centro Knight para o Jornalismo nas Amricas e pela Associao
Nacional de Jornais (ANJ); a Escola de Dados205 ministrou o curso Introduo ao
Jornalismo de Dados, na Universidade Federal do Rio de Janeiro e no ano seguinte na
Universidade de So Paulo. O Instituto Internacional de Cincias Sociais (IICS)206
tambm vem realizando um curso de uma semana de durao como parte do
Programa de Jornalismo de Dados e Visualizao. H cursos de 3 meses como o de
Jornalismo Guiado por Dados207, da Escola Superior de Propaganda e Marketing
(ESPM)208 e o Comunicao e Anlise de Dados na Era do Big Data, da Fundao
Armando lvares Penteado (FAAP).

Nas universidades h laboratrios e grupos de pesquisa que desenvolvem a temtica


como o Labic, da UFES, j citado em captulos anteriores. No h um levantamento
sobre a incluso de disciplinas especficas no ensino superior. A dissertao do
pesquisador Rafael Alves (2012), da Universidade Federal de Santa Catarina (UFSC),
apontou que h disciplinas que j contemplam infografia, com tpicos que

203
http://datajournalismcourse.net/index.php
204
https://knightcenter.utexas.edu/
205
http://escoladedados.org/
206
http://www.iics.edu.br/portfolio-item/programa-de-jornalismo-de-dados-e-visualizacao/
207
http://www2.espm.br/sites/default/files/pagina/jornalismo_guiado_por_dados.pdf
208
http://www2.espm.br/sites/default/files/pagina/jornalismo_guiado_por_dados.pdf

167

Captulo V

trabalham o design, jornalismo visual, estatstica, animao, softwares grficos e


desenho, entre disciplinas obrigatrias e optativas, com nomenclaturas como
Planejamento Grfico, Computao Grfica, Estatstica, Design Grfico,
Prticas Fotogrficas aplicadas ao Design, Programao Visual e Produo
Editorial. um assunto complexo, multidisciplinar que desafia o mercado e tambm
o ensino do jornalismo. Por isso a dificuldade em formar equipes de dados. So
atividades que possuem suas peculiaridades, que necessitam de diferentes demandas
do profissional e de investimento em armazenamento, computadores que tenham
softwares de processamento mais geis, com grande capacidade de memria, entre
outras peculiaridades que abordaremos ao longo deste captulo.

Na Universidade de Columbia, em Nova York, por exemplo, h programas projetados


para fornecer aos alunos habilidades em Cincia da Computao e Jornalismo de
Dados de forma a prepar-los para as novas carreiras de mdia digital em jornalismo.
Os alunos saem com certificao dupla. Entre as disciplinas oferecidas esto machine
learning 209 , anlise algortmica, computao e humanidades, entre outras 210 . De
acordo com Tiago Mali, que trabalha hoje na revista poca, sem os conceitos bsicos
como regra de trs, porcentagem, clculo e variaes impossvel conseguir matrias
interessantes a partir de dados. O profissional lamenta o atraso nas faculdades de
jornalismo no Brasil, que raramente incorporam conceitos do jornalismo de dados na
grade curricular ou oferecem aulas sobre apurao com o uso de Big Data.

Quando eu dava o curso de jornalismo de dados na Associao Brasileira


de Jornalismo Investigativo (Abraji) era comum gastar muito tempo
voltando a conceitos mais bsicos. Essas coisas, se voc no souber, pode
tirar concluses falsas. No estou falando de cincia espacial, no tem
nada complexo. Vale resgatar aquilo aprendido no colgio (MALI apud
PORTAL IMPRENSA, 2015)211.

Afinados com as crescentes disponibilidades de dados, a alfabetizao das pessoas


envolvidas no jornalismo de dados possibilita, em parte (e veremos o porqu mais a
frente), a disseminao e um uso mais apropriado dos contedos. Entre os
conhecimentos mais bsicos esto a probabilidade, conceitos de estatstica,


209
A Machine Learning ou Aprendizado de Mquina um mtodo de anlise de dados que automatiza o desenvolvimento de
modelos analticos.
210
http://www.cs.columbia.edu/education/ms/journalism.
211
Trecho retirado da matria Jornalistas usam novas ferramentas para filtrar boas pautas no universo do Big Data. Disponvel
em: http://www.portalimprensa.com.br/especialtecnologia/conteudo_tecnologia_09.asp. Acesso em 1 de maro de 2016.

168

Captulo V

associaes, matemtica, questes referentes a chamada cincia dos dados212, muitas


vezes noes sobre linguagem de programao, que no precisa ser de baixo nvel213,
mas pelo menos a escrita em notao, navegao criptografada. Em resumo, um olhar
mais direcionado para as necessidades especficas de se trabalhar com o jornalismo de
dados e a visualizao de dados.

Desafios do novo

Apesar das dificuldades econmicas que as empresas jornalistas enfrentam, para ns,
inicialmente, o maior empecilho para se trabalhar com dados estava na formao dos
profissionais. Na trade tempo, dinheiro e pessoas, a falta de capacitao seria um dos
grandes problemas. No entanto, ao longo desta pesquisa, percebemos que os outros
dois fatores passaram a ser os mais desafiadores. Hoje no seriam nem tanto as
expertises dos profissionais ou os recursos tecnolgicos, mas a falta de tempo e
dinheiro das empresas, uma vez que as apuraes e produes podem demorar de
horas a meses de dedicao. Os recursos tecnolgicos existem e mo-de-obra, mesmo
que ainda precise de aperfeioamento, est presente no mercado.

O desafio o mesmo do jornalismo. um negcio que consome muito


tempo e consome dinheiro. Pagar equipe, informtica, Internet. E que no
necessariamente voc vai ganhar mais dinheiro com isso. Voc no vai
ganhar mais em anncio, talvez at renda menos. O problema esse. O
maior desfio que voc no tem um modelo econmico sustentvel para
isso. A no ser que o jornal decida investir nesse tipo de trabalho, pelo
prestgio, por que est cumprindo uma razo social, mas seja pelo que for,
certamente, no pela grana. Por isso poucas equipes se dedicam ao
jornalismo de dados. Ele um pedacinho dentro desse problema
(TOLEDO, 2015).

Ao falar dos mesmos desafios, dos desafios do jornalismo, no nos vem em mente
somente a questo econmica desta crise, mas fundamentalmente a de valores, funo
social e razo de ser. H feeds de tudo, plulas informativas ganham cada vez mais
espao em redaes que parecem correr atrs de um ineditismo, de um furo de
reportagem cada vez mais difcil de ser feito em ambientes onde as pessoas j se


212
Como j apontado no primeiro captulo, uma cincia que procura descobrir conhecimento a partir de uma quantidade grande e
pesada de dados. Os resultados so muitas vezes utilizados para a tomada de decises e para fazer previses.
213
Quanto mais prxima da linguagem de mquina, mais baixo o nvel da linguagem. Quanto mais intuitiva para programar,
mais alto o nvel da linguagem. Existem trs nveis: baixo (Ex: Assembly), mdio (Ex: C, C++) e alto (Ex: Java, Pascal). Fonte:
softblue.com.br.

169

Captulo V

apoderaram das trocas informativas em alta velocidade. No que se deva parar de


fazer, mas o jornalismo no se resume somente ao factual dirio. Pelo contrrio, num
cenrio de excessos informativos a contextualizao se torna extremamente valiosa
para o pblico, mas como valorar isso financeiramente se falamos de instituies
economicamente ativas? Algumas iniciativas vem adotando consrcios para que
consigam ser desenvolvidas. Citamos uma delas no incio do captulo II (Swiss
Leaks), mas este um caminho, no h soluo para todos. A problemtica imensa e
de rumos incertos.

Retomando a proposta desta pesquisa, percebemos que a partir do operacional das


redaes de dados possvel destacar pontos a serem desdobrados sobre o jornalismo
e a visualizao de dados. Muitos j comearam a ser discutidos na rea acadmica e
de mercado, mesmo que de forma mais tmida. So questes relevantes que se
configuram como tendncias e nos ajudam a compreender melhor com o que estamos
lidando e as dimenses que est rea pode tomar. Estamos falando de: matrias que
envolvem previses; a repercusso dos contedos; o armazenamento e a recuperao
dos dados (datalizao); as solues e validaes das peas jornalsticas; a lgica da
produo dos contedos.

Previso

Alguns contedos expem fatos que j aconteceram, que estavam ocultos, outros
apresentam tendncias. Para Toledo fazer previses um grande desafio para o
jornalismo. A matria Descubra o que seu time ainda pode fazer no Brasileiro214,
publicada em outubro de 2015 foi uma das primeiras a trabalhar com este vis no blog
Estado Dados. uma das poucas tambm que no aborda a temtica poltica. A
matria focou na probabilidade do desempenho dos times, a chance que cada
agremiao tinha de ser campe no campeonato brasileiro de 2015, assim como a
chance de classificao na Libertadores da Amrica e de rebaixamento. Com
infogrficos interativos o leitor podia navegar pelas diversas possibilidades a partir
dos dados da 28a rodada de jogos.


214
http://blog.estadaodados.com/descubra-o-que-o-seu-time-ainda-pode-fazer-no-brasileirao/

170

Captulo V

Primeiro a gente calculou a probabilidade. um modelo, que j vem sendo


usado por outros veculos, quantas partidas em casa, fora de casa e diante
disso qual a probabilidade de vitrias. E ns acertamos tudo. No me
lembro de termos errado nada. Usvamos o passado como parmetro para
o futuro (TOLEDO, 2016).

Exemplos conhecidos neste ramo vem das previses do estatstico e escritor


americano, atualmente editor-chefe do blog de FiveThirtyEight 215 , da ESPN e
correspondente especial da ABC News, Nate Silver. Ele desenvolveu um sistema para
prever o desempenho de jogadores da Major League Baseball. Assim como previu
com sucesso o resultado da eleio presidencial de 2012, nos Estados Unidos, em
todos os estados com base num modelo matemtico. Enquanto comentaristas, em sua
maioria conservadores, diziam que a vitria seria do republicano Mitt Romney, Nate
Silver defendeu que o novo presidente americano seria Barack Obama. A mesma
metodologia utilizada para fazer as anlises de inteno de voto, ele alega que podem
ser usadas em coberturas de economia, esportes, cincia e cotidiano (as mesmas
editorias que esto presentes no blog FiveThirtyEight). Os mtodos por ele adotados
no se destinam a substituir o jornalismo convencional e a apurao de notcias. O
objetivo de usar a estatstica no jornalismo a explorao de diferentes maneiras onde
o consumidor pode usar dados para esclarecimentos.

Nate Silver lanou um Manifesto do Jornalismo de Dados216, em 2014, onde defende a


ideia de um jornalismo que tenha a estatstica como elemento fundamental na
reportagem. Para ele a qualidade da informao jornalstica importante, uma vez
que boa parte da populao se orienta pelo que divulgado por jornalistas. Silver
tambm defende que preciso agregar valor ao jornalismo de dados e h potencial e
mercado para isso. As pessoas deixam rastros de dados e muitos esto disponveis de
forma gratuita ou a preos baixos.

(...) eu nunca teria lanado FiveThirtyEight em 2008, e tambm no


ampliaria sua cobertura agora, se no houvesse alguma necessidade
para ele no mercado. Na minha opinio, as organizaes de notcias
convencionais, no seu conjunto, esto carentes de habilidades de
jornalismo de dados. Parte disso uma questo de auto-seleo. Os
estudantes que entram na faculdade com a inteno de
especializao em jornalismo ou comunicao tm pontuaes
acima da mdia em leitura e escrita, mas pontuaes abaixo da
mdia em matemtica. Alm disso, os jovens com habilidades

215
http://fivethirtyeight.com/
216
http://fivethirtyeight.com/features/what-the-fox-knows/. Acesso em 23 de fevereiro de 2016.

171

Captulo V

matemticas fortes normalmente tero mais alternativas para o


jornalismo quando eles embarcarem em suas carreiras e possam
entrar em outros campos (SILVER, 2014, traduo nossa)217.

Os dados tem uma origem, precisam ser apurados, interpretados e isto pode ser feito
por um cientista ou por um jornalista, por exemplo. No entanto, preciso chegar a
concluses e embasamentos consistentes. Sendo importante pensar em todo o
processo para se fazer as perguntas certas aos dados. Para isso Nate Silver usa um
processo dividido em quatro etapas: coleta; organizao; explicao; generalizaes e
concluses (SILVER, 2014) 218.

1a) O primeiro passo a coleta, a reunio de dados ou provas. Para um jornalista


tradicional, isso envolve uma combinao de entrevistas, pesquisa documental e
observaes por parte do reprter. No jornalismo de dados tambm h outros
caminhos de coletar informaes, como encomendando pesquisas e realizando
raspagem de dados em sites219;

2o) A segunda etapa a organizao. O jornalismo tradicional j tem estabelecido um


meio de organizao da informao: a formulao de notcias. A histria
desenvolvida por ordem cronolgica, por ordem de importncia (a chamada pirmide
invertida) ou de inmeras outras maneiras. Os jornalistas de dados, entretanto,
organizam as informaes utilizando estatsticas, colocando os dados em um banco de
dados relacional ou construindo uma visualizao de dados. Tendo ou no uma
imagem, estas abordagens contam histrias de forma aprofundada220;

3o) A terceira etapa a explicao. Em termos jornalsticos, preciso ir alm das


perguntas tradicionais: o que, onde, quando, como e porqu. preciso ser mais do

217
Still, I would never have launched FiveThirtyEight in 2008, and I would not have chosen to broaden its coverage so
extensively now, unless I thought there were some need for it in the marketplace. Conventional news organizations on the whole
are lacking in data journalism skills, in my view. Some of this is a matter of self-selection. Students who enter college with the
intent to major in journalism or communications have above-average test scores in reading and writing, but below-average scores
in mathematics. Furthermore, young people with strong math skills will normally have more alternatives to journalism when they
embark upon their careers and may enter other fields (SILVER, 2014).
218
Presente no Manifesto do Jornalismo de Dados disponvel em: http://fivethirtyeight.com/features/what-the-fox-knows/.
Acesso em 23 de fevereiro de 2016.
219
The first step is the collection of data or evidence. For a traditional journalist, this is likely to involve some combination of
interviewing, documentary research and first-person observation. But data journalists also have ways of collecting information,
such as by commissioning polls, performing experiments or scraping data from websites (SILVER, 2014).
220
The next step is organization. Traditional journalists have a well-established means of organizing information: They
formulate a news story. The story might proceed chronologically, in order of importance (the inverted pyramid) or in some other
fashion. Data journalists, meanwhile, can organize information by running descriptive statistics on it, by placing it into a
relational database or by building a data visualization from it. Whether or not a picture is worth a thousand words, there is value
in these approaches both as additional modes of storytelling and as foundations for further analysis (SILVER, 2014).

172

Captulo V

que um jornalismo explicativo, descritivo. O jornalismo de dados possui cada vez


mais um conjunto prprio de tcnicas, executando, principalmente, vrios tipos de
testes estatsticos para procurar relacionar os dados221;

4a) A quarta etapa das generalizaes e concluses. Para Nate Silver difcil fazer
previses, mas uma das vantagens potenciais do jornalismo de dados que ele
generaliza melhor do que as abordagens tradicionais. Possui um embasamento em um
conjunto de dados. O desafio como fazer este jornalismo vivo, acessvel a um
grande pblico, sem sacrificar o rigor e a preciso. A dificuldade tambm est na no-
linearidade do processo. preciso ir e vir muitas vezes aos dados, mudar a
organizao deles.

Repercusso do contedo

Para Toledo, entre os desafios de se trabalhar com jornalismo de dados, visualizaes,


est a questo da imprevisibilidade da aceitao. No h uma frmula de sucesso. Os
contedos e designs so trabalhados e levados aos leitores que podem ou no se
apropriar das informaes. No h como saber previamente, mas h como
acompanhar posteriormente, rastrear parte dos desdobramentos. Nos primeiros 20
meses do Basmetro, por exemplo, foram 17 reportagens produzidas somente no
jornal O Estado de S. Paulo que abordaram os dados obtidos pela ferramenta. De certa
forma, as peas jornalsticas funcionaram como fonte estruturada, que por si s so
narrativas e geram narrativas.

Para a equipe do Blog, os retornos, as participaes dos leitores so consequncias,


onde so sempre buscadas melhorias. No entanto, parece ainda ser colocado em
segundo plano a questo das mtricas de acompanhamento aos desdobramentos. As
mensuraes no esto presentes. Talvez porque ainda no haja uma real necessidade
de acompanhamento, de justificativa de execuo do projeto como um todo. Outras
formas de reconhecimento relevantes, no entanto, tem acontecido como a prpria
premiao da matria Farra do Fies, na 60a edio do ExxonMobil 2015.


221
The third step is explanation. In journalistic terms, this might mean going beyond the who, what, where and when questions
to those of why and how. In traditional journalism, stories of this nature are sometimes referred to as news analysis or
explanatory journalism. Data journalists, again, have their own set of techniques principally running various types of
statistical tests to look for relationships in the data (SILVER, 2014).

173

Captulo V

Concordamos com ANDERSON, BELL & SHIRKY (2012) e com a lgica do


sistema narrativo proposto por Daniela Bertocchi sobre a importncia deste
acompanhamento.

H uma relao estreita e simbitica entre redes de usurios e jornalistas e


dados. Os jornalistas devem ser capazes de analisar os dados e mtricas
que acompanham o seu prprio trabalho, tm uma familiaridade com a
ideia de que as mtricas representam atividade humana. Eles tambm
devem saber como entender esse feedback e interpret-lo de forma sensata,
para que eles possam melhorar o alcance e contedo de suas histrias
(ANDERSON, BELL & SHIRKY, 2013, p. 49).

Um ponto curioso levantando por Toledo a veracidade que os contedos oriundos de


grandes bases de dados apresentam. Mesmo por especialistas, parecem ganhar o status
de verdade inquestionvel; as pessoas no duvidam tanto de matrias fundamentadas
em tantos nmeros, disse. O Blog mesmo nunca foi acionado juridicamente por
nenhum assunto abordado.

Armazenamento e recuperao de dados (datalizao)

Os desafios no jornalismo so inmeros e envolvem diferentes frentes de trabalho,


que pela demanda, envolvem reas correlatas e esforos que devem estar cada vez
mais integrados nos prximos anos. O Blog seria um local de buscas constantes,
fontes para outros jornalistas e pesquisadores? Ao serem perguntados sobre isso,
Toledo e Burgarelli acreditam que no sejam realmente uma fonte permanente de
consultas para jornalistas. Apesar de algumas repercusses, no acreditam que sejam
vistos como um tipo de acervo pelos companheiros de profisso. Outro ponto notado
que os contedos postados no Blog comeam a ser difceis de serem localizados.
No caso da ferramenta Vai Passar, citada em entrevista por Toledo, s
conseguimos localiz-la pela busca e no na seo em que se encontra, que a
Grfico do Dia, sob o ttulo possvel prever as votaes da Cmara e isso diz
muito sobre os nossos partidos222. Este fator nos despertou interesse sobre a
questo do armazenamento e resgate dos contedos. Em um momento em que h
poucos arquivos no Blog, fica mais fcil lidar com a recuperao das matrias,
mas e depois? O Estado Dados possui um servidor prprio, uma escolha em um
primeiro momento de ordem operacional, mas que de acordo com Toledo no


222
http://blog.estadaodados.com/vai-passar/

174

Captulo V

interfere nas produes dos contedos. Essa uma questo de facilidade e custo, mas
no e uma questo fundamental. Pode mudar a qualquer momento. So adaptaes,
melhorias. No um fator determinante para a realizao ou no dos trabalhos
desenvolvidos (TOLEDO, 2016). E isto tambm est mais atrelado a suportabilidade
de armazenar os grandes bancos de dados, que no necessariamente ficam disponveis
para os leitores.

Conversamos com Edmundo Leite, coordenador do Acervo223, do Jornal O Estado de


S. Paulo, no especificamente sobre a questo do blog Estado Dados, mas com o
objetivo de que ele nos trouxesse informaes sobre a recuperao de contedos no
ambiente digital como um todo, o que achamos que ser um caminho muito precioso
diante do grande volume de dados na web e uma forma de cercar o objeto de estudo
desta pesquisa. Em um primeiro momento nos deparamos com a informao de que o
Brasil ainda no conta com uma instituio ou legislao que determine que
contedos produzidos na web sejam vistos como patrimnio cultural e, desta forma,
que sejam coletados, catalogados e armazenados. Por exemplo, as manifestaes de
junho de 2013224 esto arquivadas e garantidas segundo estes parmetros apenas nos
formatos impressos. O que predomina nos contedos web um carter mais efmero,
com sites que so constantemente atualizados ou que deixam de existir. Este apago
da memria da Internet j apresenta nuances. Contar algumas histrias so difceis
com a sada e atualizaes recorrentes das pginas. Por exemplo, dificilmente seria
possvel contar a histria e analisar as eleies presidenciais a partir dos sites dos
candidatos. De acordo com matria do Acervo, desde 1998, j se foram quatro
eleies presidenciais com a presena da Internet e nada foi coletado e
sistematizado225 (ENTINI, 2013).

O problema no s do Brasil. Poucos pases tm poltica ou instituies


voltadas para o arquivamento web. Algumas iniciativas tem sido tomadas
para minimizar o apago. A mais antiga delas o Internet Archive, de
1996. Atravs do Waybackmachine a instituio tem armazenado 347
bilhes de URLs de cerca de 40 pases, inclusive o Brasil com 2,5
bilhes de capturas. No fim de 2012, o contedo total representava 10
petabytes, informa Kristine Hanna, diretora do Internet Archive, em


223
O Acervo responde hoje pelo armazenamento de todo contedo digital e no-digital do jornal. Disponvel em:
http://acervo.estadao.com.br/
224
https://pt.wikipedia.org/wiki/Protestos_no_Brasil_em_2013
225
ENTINI, Carlos Eduardo (2013). Quem arquivar a Internet para as futuras geraes? Disponvel em:
http://acervo.estadao.com.br/noticias/acervo,quem-arquivara-a-internet-para-as-futuras-geracoes,9215,0.htm. Acesso em 22 de
fevereiro de 2016.

175

Captulo V

entrevista ao Estado Acervo. Em 1996, foi a vez da Austrlia coletar o


contedo produzido e que fazia referncia ao pas. O exemplo foi
seguido pela Sucia, no ano seguinte. Hoje, as
instituies pioneiras esto reunidas no Consrcio Internacional de
Preservao da Internet226 (ENTINI, 2013).

Todo o trabalho desenvolvido pela equipe do Acervo, incluindo ferramentas e


treinamentos para os jornalistas muito rico e interessante, mas um ponto chamou
ateno na conversa e acompanhamento das atividades desenvolvidas, foi o termo
datalizao. Expresso que sintetiza o desafio dos profissionais e instituies que
trabalham com preservao. Em matria publicada em 2013, na pgina do Acervo,
Edmundo Leite registrou o assunto na cobertura do III Seminrio
Internacional Aquivos e Museus de Pesquisa227, realizado em So Paulo. Nele a
professora Marcia Lei Zeng, da Faculdade de Biblioteconomia e Cincia da
Informao da Universidade de Kent, nos Estados Unidos apontou que a datalizao
a chave para que a enorme massa de contedos digitais possa ser organizada de
modo a ser encontrada, compartilhada e integrada com outras bases de dados
(LEITE, 2013) 228. Ela apontou ferramentas, prticas e protocolos disponveis na web
como o Linked Open Data 229 e as buscas semnticas como meios para que
documentos digitais possam ser encontrados com mais facilidade e se integrar a
outros.

Uma pgina na Internet que estiver datalizada com a codificao e


classificao corretas de metadados (informaes sobre o contedo) poder
capturar automaticamente informaes de outros sites que
acrescentem mais dados quele contedo originalmente isolado. Assim,
uma instituio que possui uma carta digitalizada do imperador brasileiro
Dom Pedro II poder agregar ao documento dados de livros publicados
sobre ele ou por ele, o verbete da Wikipedia ou qualquer outro site que
possuir documentos de sua autoria, bem como incorporar um mapa on-line
que tiver listado lugares onde ele nasceu ou pelo qual passou. Na mo
inversa, um pesquisador que pesquisar sobre Dom Pedro II em outro site
poder chegar carta digitalizada daquela instituio atravs dessas outras
fontes, e no somente pelo prprio site da instituio ou dos buscadores
convencionais disponveis na internet (LEITE, 2013)230.

226
O Consrcio Internacional de Preservao da Internet (IIPC)226 uma organizao virtual, colaborativa, descentralizada,
fundada em 2003. Com o objetivo de coletar, preservar e tornar acessvel o contedo web para geraes futuras, atua na
construo de tecnologias e no conhecimento em meios de armazenar sistematicamente as informaes produzidas na web.
Rene cerca de 40 instituies (bibliotecas, arquivos, Internet Archive) em cerca de 30 pases.
227
http://www.sescsp.org.br/programacao/seminario/3017_III+SEMINARIO+INTERNACIONAL+ARQUIVOS+DE+MUSEUS
+E+PESQUISA#/content=apresentacao_mais
228
LEITE, Edmundo. Datalizao o desafio na era da digitalizao. Disponvel em:
http://acervo.estadao.com.br/noticias/acervo,datalizacao-e-o-desafio-na-era-da-digitalizacao,9285,0.htm. Acesso em 5 de
dezembro de 2015.
229
https://vimeo.com/36752317
230
Disponvel em:
http://www.sescsp.org.br/programacao/seminario/3017_III+SEMINARIO+INTERNACIONAL+ARQUIVOS+DE+MUSEUS+E
+PESQUISA - /content=apresentacao_mais. Acesso em 29 dezembro de 2015.

176

Captulo V

A datalizao aparenta ser um procedimento que impactar em diversas reas,


inclusive no jornalismo. Alm do jornalista escrever pensando que o texto ser um
dado para diversos formatos, o que refora o j citado no captulo II, a produo e
armazenamento de informao deve ser compatvel para qualquer fim. A recuperao
diante do volume de dados um ponto que estar a frente de discusses e melhor
aplicabilidade, assim como a escrita em notao, por exemplo. Como meio de
permanncia, Ramalho (2015) recomenda uma escrita em notao, uma vez que
difcil definir quanto tempo um processador de texto como o Microsoft Word existir,
por exemplo. Ser que daqui h 100, 200 anos ele estar em uso, em larga escala?
Dispositivos podero existir para fazer as tradues para outros softwares, mas talvez
seja algo que deva ser melhor discutido por quem trabalha e produz informao:
arquivamento e recuperao de dados.

Soluo e validao das peas

A anlise automtica de grandes corpos textuais criou a possibilidade para os


estudiosos de analisar milhes de documentos em vrios idiomas com interveno
manual muito limitada. Entre as tecnologias e tcnicas facilitadoras de anlise
encontram-se machine translation231, categorizao de tpicos e machine learning.
Elas facilitam processos. No caso da machine learning, o uso de algoritmos permite o
aprendizado de mquina de forma interativa, onde podem ser encontrados insights
ocultos sem serem explicitamente programados para procurar algo especfico.

O aspecto interativo do aprendizado de mquinas importante porque,


conforme os modelos so expostos a novos dados, eles so capazes de se
adaptar de forma independente. Eles aprendem com os clculos anteriores
para produzir decises e resultados confiveis e reproduzveis. uma
cincia que no nova, mas que est ganhando um novo impulso (SAS,
2015)232.

O diferencial da aprendizagem de mquina na contemporaneidade est na aplicao


automtica de clculos matemticos complexos a Big Data de forma cada vez mais
rpida. Para Toledo, machine learning basicamente fazer o algoritmo para que ele se

231
A Machine Translation ou Traduo Automtica (TA) o processo automtico de traduo de um idioma para outro atravs
do computador. Em um nvel mais bsico, executa a substituio simples de palavras, mas em sistemas mais complexos podem
reconhecer variaes lingusticas e semnticas.
232
Disponvel em: http://www.sas.com/pt_br/insights/analytics/machine-learning.html. Acesso em 28 de dezembro de 2015.

177

Captulo V

auto-aperfeioe. H inmeras ferramentas gratuitas que oferecem servios de solues


semelhantes. A IBM, por exemplo, desenvolveu o Watson, um sistema desenhado
para responder s perguntas de um dos programas de televiso americanos mais
importantes chamado Jeopardy!. O Watson pioneiro no processamento da
linguagem e analtica e, a partir dele, foram divulgadas 18 ferramentas gratuitas em
plataforma de nuvem233, como o Visual Recognition, que permite analisar imagens ou
trechos de vdeos para compreender o que acontece em uma cena234; Cognitive
Commerce, que traz oportunidades comerciais para consumidores e negcios por
meio de recomendaes mais relevantes, de forma personalizada235 e o Cognitive
Graph, que um recurso que agrupa conhecimento fornecido por terceiros, dados
internos, fontes privadas de informaes e usa modelos de domnio especfico em
respostas com representao grfica236. No caso especfico do Estado Dados so
usados em algumas peas os conceitos de machine learning.

Voc trabalha algumas coisas em R pra desenvolver o clculo estatstico.


Por exemplo, a cada rodada do campeonato brasileiro a probabilidade de
um time ganhar maior do que a de outro e a mquina j faz o clculo
automaticamente. No caso da matria sobre o campeonato brasileiro, quem
fez a alimentao dos dados foi o Guilherme, assim como o modelo
estatstico. Ele pois a mo na massa e o meu papel foi o de ser o chato,
criticar, pedir para mudar algoritmo (TOLEDO, 2016, anotaes).

Muitas vezes as mquinas fazem os clculos, mas a checagem das informaes


acontece como em qualquer matria. Como comenta o coordenador do blog Estado
Dados, com eles no h um protocolo fixo de procedimentos, uma vez que os casos
so variveis. Buscamos ver se o resultado faz sentido, se as somas realmente do
100%. No h uma frmula, um protocolo de checagem. A gente trabalha com
assuntos to variados que prevalece a preocupao de no gerar nenhum processo
(TOLEDO, 2016, anotaes).

O importante saber exatamente o que se quer e como trabalhar os dados.


Compreender que h diferenas entre aprendizado de mquina e minerao de dados,

233
Disponvel em: http://idgnow.com.br/ti-corporativa/2016/02/26/watson-oferece-18-ferramentas-gratuitas-em-plataforma-de-
nuvem-da-ibm/
234
Usando recursos de aprendizado de mquinas, um sistema ajuda no reconhecimento e classificao semntica de informaes
visuais, com objetos ou eventos. A ferramenta vem com alguns modelos de imagens j reconhecidos para prover resultados com
base em analise e aproximao. A verso beta gratuita.
235
O servio, disponibilizado no Bluemix por um parceiro IBM chamado Cognitive Scale, ajuda empresas em transaes
comerciais. Tambm gratuito em verso beta.
236
A soluo usa machine learning e pode ser aplicada em diferentes tipos de problemas. Grtis em verso beta.

178

Captulo V

por exemplo, mas que h muitas outras complexidades do processo que interferem no
resultado final dos dados obtidos. Desde questes mais simples como a
compatibilidade de mquinas, quanto ao uso de clculos de forma correta. De
qualquer forma, estas variaes devem gerar somente pequenas variaes. No incio
do livro Anlise Poltica & Jornalismo de Dados (TOLEDO et. al, 2014), feito um
alerta sobre possveis variveis no processamento da base de dados da ferramenta
Basmetro conforme o navegador do usurio.

Isso significa que podem haver diferenas mnimas nos resultados dos
filtros e cruzamentos, em funo das caractersticas do computador de cada
um. Isso no invalida, com base em diversos testes, os resultados colhidos,
e no ofusca o brilho da ferramenta, que nos permite compreender e
analisar a realidade de nosso parlamento federal em anos recentes
(TOLEDO et al. 2015, p. 12).

Novamente, o importante e relevante que as variaes sejam reconhecidas e


mnimas, que permitam que o usurio faa idas e voltas e tenha conhecimentos sobre
as fontes dos dados e caso interesse, cheque as informaes, a partir das fontes
originais.

A lgica da produo dos contedos

No blog Estado Dados no h uma rotina de trabalho propriamente dita como nas
demais redaes jornalsticas, inclusive como a do prprio jornal O Estado de S.
Paulo. De acordo com Rodrigo Burgarelli, o processo de produo da pauta comea
com uma pergunta, seguida de uma parte mais tcnica que a obteno da base de
dados, tratar, fazer a anlise, algo que, muitas vezes, no vai ser feito por quem teve
a ideia. E depois tem que entrevistar pessoas, fazer fotos, vdeos, escrever. uma
tarefa multidisciplinar (BURGARELLI apud PORTAL IMPRENSA, 2015). So
diversas frentes de trabalho desenvolvidas e a atualizao do Blog no tem a
obrigatoriedade de ser diria. O gerenciamento complexo.

A gente est sempre caando novas bases de dados e olhando as antigas


com novos pontos de vista. As pautas, as ideias, vo surgindo. Voc as
vezes perde tempo com uma base e ela no te leva a lugar nenhum. A
gente faz, sem uma ideia pr-concebida, de esprito aberto, para tentar
buscar os assuntos. O mtodo um pouco catico, eu diria. No sempre
do mesmo jeito. Na verdade a gente tem muito mais ideia do que
capacidade de executar, mas assuntos no faltam. O que falta tempo
(TOLEDO, 2016, anotaes).

179

Captulo V

As lgicas dos processos de produo interessam a presente pesquisadora, que em


outros momentos j foi buscar conhecimentos bsicos sobre gerenciamento de
projetos e desenvolvimento de softwares. Assunto que acabou cruzando com as
informaes obtidas em setembro de 2015, quando o programador e designer Carlos
Lemos, que j fez parte da equipe do blog Estado Dados e hoje integra a equipe do
Globo Esporte fez uma palestra no encontro Hacks Hackers denominada A cultura
dos desenvolvedores dentro da redao do Globo Esporte 237. O objetivo da palestra
foi discutir exatamente a funo do programador e da programao dentro das
redaes jornalsticas. Se antes a nica funo era solucionar bugs no sistema, agora,
com o fim do Flash, as luxuosas visualizaes de dados e a evoluo natural da
produo de contedo para a rede nos mostram que precisvamos de equipes mais
robustas dentro das empresas jornalsticas, disse Lemos (2015, anotaes). A
pergunta-problema da palestra foi: como se deu essa integrao entre programadores e
redao jornalstica?

Carlos Lemos apontou qual o seu trabalho hoje dentro do ambiente redacional. Um
cotidiano que envolve o manuseio de grande volume de dados; armazenamento e
curadoria dos dados aplicado nas editorias jornalsticas; integrao de diferentes
profissionais na execuo de cada pea jornalstica; a necessidade de alimentao
atualizada, mas no diria. Elementos que temos discutido e apontado ao longo desta
pesquisa. No entanto, o ponto que chamou a ateno um desdobramento da questo
dos tempos de produo e execuo diferentes em cada etapa do processo da
construo narrativa e da necessidade das expertises dos profissionais envolvidos
estarem integrados. Lemos defende e aplica o uso de tcnicas de planejamento e
gesto. No caso especfico apresentado durante a palestra, do uso de um Scrum238
jornalstico para se trabalhar com dados.

O Scrum um processo de trabalho em equipe, em um projeto que possui uma mesma


finalidade, desenvolvimento de tarefas e metas que so compartilhadas e possuem um
feedback (retorno) rpido de produtos e dos processos de trabalho. um framework

237
O bate-papo com Carlos Lemos aconteceu no dia 24 de setembro de 2015, no Instituto Internacional de Cincias Sociais
(IICS), em So Paulo. Disponvel em: http://www.meetup.com/pt-
BR/hackshackerssp/events/225232624/?eventId=225232624&chapter_analytics_code=UA-30964380-17.
238
O gerente de desenvolvimento de softwares Hamid Shojaee, fundador da empresa Axosoft fez um vdeo de 10 minutos
explicando de forma ilustrativa o que um scrum. Ele trabalha com softwares de gerenciamento de projetos gil usado por mais
de 11.000 equipes em todo o mundo. Disponvel em: https://www.youtube.com/watch?v=XU0llRltyFM. Acesso em 29 de
fevereiro de 2016.

180

Captulo V

(caixa de ferramentas) de desenvolvimento iterativo e incremental utilizado


no gerenciamento de projetos e desenvolvimento de software gil. Funciona como um
conjunto de valores, princpios e prticas que fornecem a base para que a
organizao adicione prticas particulares de engenharia e gesto e que sejam
relevantes para a realidade de cada empresa, fazendo com que cada uma tenha um
Scrum prprio239. O foco est no gerenciamento de projetos onde difcil planejar
frente. No um sistema que descreve o que fazer em cada situao, mas usado para
trabalhos complexos nos quais impossvel predizer tudo o que ir ocorrer. Temos a
viso macro de uma narrativa como sistema, um processo em fluxo, como discutido
no captulo III.

Agora estamos falando da aproximao entre os sistemas de informao das


tcnicas de comunicao gil em vrias escalas de uso. No somente para dentro
das redaes enquanto integrantes de uma empresa, mas para dentro das
editorias e tambm de cada processo narrativo. um assunto um tanto quanto
complexo, mas j em uso em uma etapa em que as redaes ou grupos de
trabalhos jornalsticos j esto inseridos num cenrio de uso de base de dados,
ou seja, que j passaram pela etapa de que jornalismo de dados se faz com
equipes que em um nico trabalho compreendem tcnicas de extrao de dados,
usos de ferramentas e softwares, anlises e correlao de dados. Trabalham com a
visualizao de dados e visualizao da informao e precisam de alguma forma
sistematizar os processos de execuo dos contedos no ambiente interno diante do
fluxo informativo dos processos de narrao da contemporaneidade. O que nos leva a
questo de que, enquanto jornalistas, dependendo das funes exercidas e da rea de
atuao, devemos atentar para gerenciar dados em uma lgica de sistemas de
produo e execuo de projetos.

Sustentao terica vinculada a core category

A nossa core category para definir que a pea jornalstica se trata de uma
visualizao de dados, aos moldes do que discutimos ao longo desta pesquisa,
est na relao entre: o Big Data, o jornalismo de dados e o sistema narrativo.


239
Outras informaes podem ser obtidas em www.desenvolvimentoagil.com.br.

181

Captulo V

Onde a visualizao de dados jornalsticos aparece como um formato em


constante dilogo com o design. Uma construo que acontece de forma no
linear e que tem processos prprios que dependem dos dados, das linguagens,
das ferramentas, dos locais de armazenamento e das formas de resgate dos
contedos. Compreender porque o texto analisado (seja ele numrico ou no) se
apresenta de determinada maneira compreender o seu sistema de organizao, a sua
estrutura. Identificamos conceituaes, mas no processos regulares e repetveis de
produo, uma vez que, como pode ser observado pelos exemplo, no h uma nica
maneira de execuo para se trabalhar os contedos originrios de bases de dados e
que geram visualizaes de dados. O nosso diagrama pode ser compreendido da
seguinte maneira:

Figura V. 21 A visualizao de dados no jornalismo contemporneo

Jornalismo de
Big Data
Dados

Sistema
Narrativo

Formato Design

Visualizao de
dados
jornalsticos

Fonte: Mayanna Estevanim, 2016

182

Captulo V

Atravs dos exemplos apresentados ao longo deste captulo sustentamos que o fator
tecnolgico um dos pr-requisitos para o desenvolvimento das peas jornalsticas,
auxiliando no manuseio de dados e metadados. No ambiente digital, a narrativa
deixou de ser compreendida como texto e imagens estaticamente diagramados.
dinmica e em constante transformao no tempo e no espao digital, onde o usurio
experimentou o fluxo contnuo de eventos. Quando a narrativa chegou a uma interface
para o usurio ela j foi formatada, mas o seu fluxo continuou uma vez que os
usurios puderam acrescentar comentrios, compartilhar informaes, curtir e sugerir
melhorias. Os exemplos envolveram investigaes e inmeras correlaes de dados
que foram apresentadas aos leitores de maneiras distintas como em ferramentas,
infogrficos e mapas.

As bases de dados no necessariamente apareceram ao usurio/leitor, uma vez que


serviram apenas como fonte para a produo de contedos jornalsticos, alm de
apresentaes infogrficas, mapas, entre outros recursos visuais. Confirmando que a
visualizao um meio de transformar dados em informao semntica, criando ou
no ferramentas para que qualquer pessoa faa a leitura e interpretao de um
processo informativo. Os jornalistas envolvidos foram modeladores da narrativa em
camadas, tendo o auxlio de equipes humanas e no-humanas resultando em uma
experincia narrativa centrada nos usurios. Quanto maior a familiaridade com as
camadas subterrneas do sistema narrativo, melhores foram as formas de atuao,
interveno e de contar histrias no ciberespao.

No entanto, o que ficou claro que as novas possibilidades para o jornalismo exigem
diferentes formas de organizao e somente a incorporao de tcnicas no sero
suficientes para a adaptao a este novo ecossistema. H um carter tcnico de
escolhas de apresentao das peas, telas, bandas largas, polticas de uso de dados,
mas tambm h questes que envolvem a essncia jornalstica na contemporaneidade.
preciso dar valor e funcionalidade ao jornalismo. No so s produtos, so fluxos,
onde o jornalismo esteve no centro da execuo, independentemente da formao do
profissional envolvido.

183

Captulo V

O nvel de profundidade da pesquisa de dados nas matrias foi fundamental para a


criao das peas premiadas, que alm do ineditismo no cenrio nacional, puderam
responder perguntas, permitiram cruzamento dados e quando no, deram sentido a
eles priorizando elementos visuais que foram funcionais e contriburam para a
eficcia do entendimento dos assuntos abordados.

Consideraes

Neste captulo partimos, inicialmente, de uma viso macro do blog Estado Dados
onde buscamos compreender as dinmicas do trabalho da visualizao de dados
dentro da redao, atentando para a formao dos profissionais envolvidos, para as
generalizaes sobre construes noticiosas, estrutura de trabalho e investimentos no
ncleo de dados; assim como as principais dificuldades em lidar com dados. Em um
segundo momento optamos por nos aprofundar em exemplos de peas jornalsticas
desenvolvidas pela equipe, com foco na ferramenta em visualizao de dados
Basmetro e na srie de reportagens-denncia Farra do Fies. Acreditamos que a partir
deste caminho, com a seleo da amostra e com a sustentao terica pudemos
responder a pergunta-problema desta pesquisa: o que a visualizao de dados no
jornalismo? Como ela se insere na prtica e na narrativa do jornalismo de dados
proporcionando diferenciais relevantes? As observaes mais sistematizadas e as
reflexes desencadeadas a partir do ambiente da redao jornalstica nos geraram
empiricamente categorias, sendo possvel repercorrer o processo de gerao das
mesmas. Acreditamos que as categorias e os processos apresentados abrem novas
perspectivas sobre os estudos, sendo til, principalmente, para os envolvidos
diretamente no jornalismo de dados, sugerindo pistas para mudanas e inovao.

De posse do material de campo, entrevistas e observaes sistematizadas, as reflexes


foram desencadeadas sob dois aspectos: os pontos jornalsticos que se destacavam no
ambiente redacional e os desafios de se trabalhar com a visualizao de dados no
jornalismo. Os pontos jornalsticos destacados foram:

- finalidade do contedo que define o design que chegar ao leitor e o desenrolar da


construo narrativa;

184

Captulo V

- os testes, adaptaes e autodidatismo as experimentaes feitas por parte da


equipe para que a mensagem seja passada e as possveis indagaes dos leitores sejam
esclarecidas;

- o faro jornalstico e a formao da equipe caractersticas bsicas que devem


nortear todos os envolvidos na produo jornalstica para que as perguntas certas
sejam feitas aos dados.

Entre os desafios para se trabalhar com o jornalismo de dados, que impactam


diretamente nas tendncias e continuidade da prtica, destacamos a trade tempo,
dinheiro e pessoas, onde a falta de mo-de-obra qualificada no aparece como o maior
empecilho, mas sim a falta de recursos para manter apuraes e produes que
ocorrem de maneira distinta da lgica predominante do exerccio do jornalismo, num
cenrio j desfavorecido por modelos de negcios que no mais se sustentam. A partir
do acompanhamento da redao, as reflexes desencadeadas levam a situaes,
tendncias e possveis desdobramentos do fazer visualizao e jornalismo de dados,
que so:

- os contedos jornalsticos de previso que utilizam mtodos para abordar situaes


futuras no de forma especulativa, mas baseadas em dados;

- a repercusso das peas sua imprevisibilidade e muitas vezes necessidades de


ajustes na busca por melhorias na apresentao ou entrega dos dados;

- o armazenamento e recuperao de dados onde o termo datalizao surge como


sntese do desafio dos profissionais e instituies que trabalham com a preservao.
Fato este que os jornalistas ainda precisam ter mais zelo;

- a soluo e validao das peas usos de algoritmos e robs em tecnologias


facilitadoras de analises de grandes conjuntos de dados. A to falada aprendizagem de
mquina que auxilia a encontrar variveis nos dados e nas construes das bases de
dados;

- a lgica da produo dos contedos onde esto presentes diferentes maneiras de se


185

Captulo V

trabalhar no ambiente redacional voltado para a prtica do jornalismo de dados.


Falamos aqui do gerenciamento que envolve o desenvolvimento de peas
simultaneamente.

A visualizao de dados jornalsticos para ns um formato que tem processos


prprios que dependem dos dados, das linguagens e ferramentas, locais de
armazenamento e formas de resgate. A core category para definir que a pea
jornalstica se trata de uma visualizao de dados baseia-se, portanto, na relao entre
Big Data, jornalismo de dados, sistema narrativo, a partir do formato visualizao de
dados. Tendo um dilogo constante e no linear com o design das peas.

186

Consideraes Finais

VI. CONSIDERAES FINAIS

No dia 8 de maro de 2016, o jornal O Estado de S. Paulo esteve em 4o lugar no


Trending Topics do Twitter Brasil. Como parte de uma campanha pelo Dia
Internacional da Mulher, o jornal abriu seu perfil e divulgou relatos de violncia
exatamente como eles so registrados no pas, a cada 7 minutos 240. O Estado
registrou 11,6 milhes de visualizaes em seu perfil. Um aumento de mais de 152%
em sua mdia diria. Segundo dados do Twitter, em 24 horas a hastag
#7minutos1Denuncia teve 28,2 mil menes. As 205 denncias foram retuitadas mais
de 23 mil vezes. De acordo com o professor e pesquisador Fbio Malini, do
Labic/UFES, foi um exemplo de jornalismo e transmidialidade. S isso evidencia
que o "espalhar em massa", ao de sujeitos diferentes (incluindo a grupos
feministas), alcanou o objetivo do Estado em propagar a indignao contra a alta
estatstica de violncia contra a mulher241, disse Malini.

A anlise dos dados e gerao da imagem gerada pela hastag #7minutos1Denuncia foi
divulgada no dia 9 de maro, um dia depois do fenmeno. A ferramenta utilizada foi o
Gephi, mas este exemplo envolveu um mtodo de anlise de redes que busca
identificar, processar e interpretar os pontos de vistas que so expressos no espao e
tempo das interaes em redes sociais. Pontos de vista que muitas vezes partem de
reflexes complexas que envolvem teorias antropolgicas (como as formuladas por
Eduardo Viveiros de Castro de onde so retirados os conceitos de perspectiva e
relao); os estudos sobre cartografia, grupos, mediadores, intermedirios (que advm
muitas vezes de Bruno Latour sobre a teoria ator-rede); envolvem conceitos de
clusterizao, modularidade, centralidade, densidade (oriundos da teoria dos grafos).
Informaes que dizem respeito sobre comportamento coletivo, engajamento do
pblico e retorno imediato para o prprio veculo de comunicao sobre a sua
iniciativa. mais um exemplo que est inserido no universo que objetivamos
apresentar ao longo desta pesquisa, que envolve um grande volume, variedade e
velocidade ao lidar com dados. Envolve correlao de informaes, anlise,

240
Disponvel em: http://brasil.estadao.com.br/noticias/geral,campanha-do-estado-no-dia-da-mulher-repercute-no-
twitter,10000020436. Acesso em 10 de marco de 2016.
241
Disponvel em:
https://www.facebook.com/photo.php?fbid=10154019269101151&set=a.477225711150.296154.703916150&type=3&theater.
Acesso em 9 de marco de 2016.

187

Consideraes Finais

apresentao visual para a melhor compreenso do fenmeno e da repercusso pelo


pblico. No focamos nesta pesquisa especificamente na anlise de redes sociais, mas
sim em um jornalismo que se apropria de recursos tecnolgicos, cruzamento de banco
de dados, mtodos de anlise, construes de mapas, cartografias, infogrficos
dinmicos em narrativas diferenciadas que fornecem ao usurio o entendimento de
temas complexos de relevncia social, de forma visual, diante das diferentes
possibilidade de compreenso informativa da sociedade contempornea.

Figura 22 Hashtag #7minutos1Denuncia Twitter, 8 de maro de 2016


Fonte: Perfil Fbio Malini, Facebook, 2016242

O intuito desta dissertao foi problematizar a visualizao de dados no jornalismo


brasileiro partindo exatamente do que a visualizao de dados, mais especificamente
no jornalismo de dados, e diante dos apontamentos sobre seu conceito e prtica
questionar como esta visualizao se insere na narrativa jornalstica proporcionando
diferenciais relevantes. Por relevantes partimos da premissa de pautas de interesse


242
Disponvel em:
https://www.facebook.com/photo.php?fbid=10154019269101151&set=a.477225711150.296154.703916150&type=3&theater.
Acesso em 9 de marco de 2016.

188

Consideraes Finais

pblico, que envolvem maior criticidade, maior aprofundamento e contextualizao


dos contedos no Big Data. Por ser um tema complexo da contemporaneidade, foram
muitas idas e vindas para cercar o objeto conceitualmente e necessrios diferentes
olhares e reflexes terico-metodolgicas para entender a atualidade.

O quarto captulo foi essencial para demonstrar os caminhos metodolgicos


percorridos nesta pesquisa e os rumos para as observaes de campo que foram
apresentadas no captulo V. Sintetizou as dificuldades dos estudos em Comunicao
na contemporaneidade e o olhar que demos aos fenmenos neste contexto. Um olhar
que tem a Comunicao como centro, que perpassa todas as atividades comunicativas
e informativas de forma transversal. Optamos por resilincias diante das abordagens
terico-metodolgicas para que as mesmas conseguissem abarcar e sustentar as
reflexes referentes ao dinmico campo de estudos. Elementos que justificaram
nossas escolhas metodolgicas que envolveram cruzamentos de distintos caminhos:
pesquisa bibliogrfica, observao no-participante, estudo de caso, fundamentos da
Grounded Theory, cursos, disciplinas, grupo de pesquisa Com+, palestras, estgio de
um ano na disciplina Jornalismo on-line. Refletimos dos dados de campo para as
teorias emergente e tambm fizemos a trajetria contrria para fazer as proposies e
interpretaes. Sustentamos o paradigma Jornalismo Digital em Base de Dados, tendo
as contribuies dos conceitos de formato (RAMOS, 2012 e MACHADO, 2003), de
jornalismo ps-industrial (COSTA, 2014), sistema narrativo e antenarrativa
(BERTOCCHI, 2013) como meios de amadurecimento da compreenso do objeto
proposto.

Nosso desafio nesta pesquisa foi o foco no no resultado final, mas na compreenso
sobre como os processos se estabelecem no mbito deste manuseio de dados e
metadados; de tornar visvel o invisvel. Para ns a visualizao de dados se
confirmou como um processo no-linear, trabalhado no jornalismo de dados que se
encontra em rea fronteiria de estudo, possuindo caractersticas prprias que o
distingue de outras prticas. Consideramos a visualizao de dados jornalsticos como
um formato que recorre utilizao de softwares de processamento de dados que
esto envolvidos nas camadas de dados e metadados do sistema narrativo, traduzindo
a complexidade dos dados e suas correlaes atravs de modelos visuais. Uma ao
que envolve o jornalismo visual, cientfico, investigativo, as tcnicas do RAC e que
189

Consideraes Finais

emerge a partir de congruncias e manuseio de grandes volumes de dados. Podemos


dizer que neste ecossistema comunicacional o jornalista passa a assumir um papel de
humanizao dos dados servindo como um investigador, algum que traduz e conta
fatos. tambm um curador de notcias diante da variedade, velocidade e quantidade
de informaes disponveis.

Nossa preocupao teve como foco as discusses em mbito nacional, uma vez que as
questes polticas e leis de transparncia interferem na produo e disseminao da
prtica no pas. Distinguimos em trs principais reas como as visualizaes de dados
vem aparecendo no cenrio jornalstico brasileiro: nos veculos tradicionais de mdia,
nas iniciativas independentes e nos laboratrios acadmicos. De imediato percebemos
que a formao das equipe, o tempo de produo dos contedos e as fonte dos dados
so distintos de outras prticas jornalsticas, frutos de um sistema narrativo que na
contemporaneidade adquire novas rotinas produtivas. Sustentamos que o jornalismo
de dados e a visualizao de dados esto inseridos em sistemas narrativos condizentes
com processos inovadores no jornalismo contemporneo, onde o jornalista no
somente um narrador de fatos, ele o responsvel por coletar, apurar, interpretar e
contextualizar as informaes. Recorre a grficos interativos, solicita imagens e
informao ao pblico/leitor, disponibiliza acesso direto a bancos de dados e distribui
matrias por redes sociais.

O uso de bases de dados reconfigura, pelo vis do cruzamento de dados, um contedo


mais original ao jornalismo, onde os dados podem ser somados, comparados,
integrados entre si. Neste contexto, as bases de dados so essenciais, mas no esto no
centro do sistema narrativo, uma vez que devem ser considerados outros elementos
como os algoritmos, os sistemas publicadores e os metadados. Para ns, os dados,
metadados e formatos possuem importncia similar no processo de construo
narrativa e ignorar uma destas camadas representa perdas no jornalismo de dados e
consequentemente na visualizao de dados.

As possibilidades de formatao jornalstica envolvem o agenciamento de inmeras


camadas, onde estes formatos no se constituem como gneros jornalsticos, mas
como design de gnero porqu, enquanto o gnero discursivo da ordem da lngua,
o formato da ordem das linguagens modelizadas pelos cdigos culturais
190

Consideraes Finais

tecnolgicos. No estando no ambiente semitico da codificao tecnolgica, o


formato no pode ser concebido. Seja como um processo ou como um produto, eles
possuem uma lgica interna de construo. O formato mais do que um artefato, do
que um resultado final. Ele um processo, em fluxo, resultado de um sistema aberto e
que est em constante mudana sejam eles visualizaes de dados, com ou sem usos
de algoritmos em seu desenvolvimento.

Defendemos ao longo da pesquisa que o jornalista no foi substitudo e muito menos


extinto, mas sim, neste cenrio, exerce funes de verificar, interpretar e dar sentido
enxurrada de textos, udios, fotos, vdeos em narrativas originais e criativas. O olhar
aos dados tem um carter imersivo sobre determinado assunto, de cunho
investigativo e muitas vezes inclui outros meios, como entrevistas, depoimentos,
elementos que venham a contribuir para o conhecimento. O jornalista pode participar
tanto como produtor do contedo como do desenvolvimento de softwares. um
curador de notcias que se familiarizado com as camadas subterrneas do sistema
narrativo encontra melhores maneiras de contar histrias. A camada mais prxima da
superfcie o formato. Eles modelizam as linguagens digitais sendo interfaces para as
bases de dados disponveis no ciberespao. Na camada da antenarrao onde
ocorrem grandes influncias no sistema narrativo, que podem alterar seu
comportamento pensando numa computao social centrada no humano. Pensar no
formato narrativo digital pensar em como os usurios se apropriam de servios,
tecnologias e dispositivos num contexto digital. E neste contexto, o jornalismo se
desenvolve no agenciamento coletivo de diferentes atores (jornalistas, designers,
engenheiros, programadores, arquitetos de informao, especialistas em negcios,
usurios, algoritmos, robs, softwares, entre outros).

Acreditamos que a pesquisa contribui para os estudos da Comunicao


contextualizando as teorias com o cenrio atual proporcionado pelos avanos
tecnolgicos na coleta e no auxlio ao tratamento de grandes volumes de dados no
jornalismo. No captulo V mostramos a construo do contedo noticioso a partir da
visualizao em base de dados, tendo como objeto de estudo o jornalismo de dados no
Brasil, com estudo de caso do blog Estado Dados, do jornal O Estado de S. Paulo. A
escolha se deu por ter no Blog tanto contedos grficos, quanto projetos em
visualizao, pelas atualizaes mais constantes e por estar em um cenrio brasileiro

191

Consideraes Finais

de investimentos nesta rea, o que nos possibilitou um estudo com maior


embasamento de campo diante dos nmeros de experincias em prticas. Buscamos
com o estudo de caso, um mtodo de coletar dados do corpus, a possibilidade de
aprofundar a pesquisa, de avaliar quantitativamente e qualitativamente os processos
envolvidos na produo de contedos que envolvam o manuseio de grande volume de
dados. O estudo de caso permitiu a profundidade necessria para obter parte da
compreenso desejada. A pesquisa foi prosseguida pela Grounded Theory, que fez
emergir processos subjacentes s afirmaes dos participantes e ao fenmeno
observado.

Observamos como os contedos jornalsticos foram desenvolvidos a partir de fontes,


uso de softwares e metodologias de anlise de dados. E a partir desta fase, indagamos
sobre o papel do jornalista neste cenrio onde dados podem ser somados, comparados
e integrados entre si, complementando os grandes blocos de texto que o computador
s consegue mostrar, mas no correlacionar, sem ser programado para isso. A criao
de programas e algoritmos que substituem o trabalho humano de reportagem envolve
uma srie de decises que devem ser passveis de explicao e responsabilizao para
todos os afetados. Aplicativos de softwares baseados na web precisam da mediao
humana, profissional, para emergir e interpretar as informaes. No basta torn-las
acessveis ou legveis; preciso torn-las compreensveis e relevantes, ter valor
jornalstico. Entre os desafios de se trabalhar com o jornalismo de dados percebemos
que a falta de mo-de-obra qualificada no apareceu como o maior empecilho, mas
sim a falta de recursos para manter apuraes e produes que ocorrem de maneira
distinta da lgica predominante do exerccio do jornalismo, num cenrio j
desfavorecido por modelos de negcios que no mais se sustentam.

A nossa core category para definir que a pea jornalstica se trata de uma visualizao
de dados, aos moldes do que discutimos ao longo desta pesquisa, foi a relao entre:
Big Data, Jornalismo de Dados, Sistema Narrativo, Formato, Visualizao de Dados e
Design. Identificamos conceituaes, mas no os processos de produo
padronizveis, uma vez que, como pode ser observado, no h uma nica maneira de
execuo para se trabalhar os contedos originrios de bases de dados e que geram
visualizaes de dados. O acompanhamento da redao nos levou ao confronto entre
teorias emergentes e as observaes. Os pontos jornalsticos destacados foram: 1.
192

Consideraes Finais

finalidade do contedo (que define o design que chegar ao leitor e o desenrolar da


construo narrativa); 2. os testes, adaptaes e autodidatismo (as experimentaes
feitas por parte da equipe para que a mensagem seja passada e as possveis indagaes
dos leitores sejam esclarecidas); 3. o faro jornalstico e a formao da equipe
(caractersticas bsicas que devem nortear todos os envolvidos na produo
jornalstica para que as perguntas certas sejam feitas aos dados).

Entre as reflexes desencadeadas, que nos levaram a situaes, tendncias e possveis


desdobramentos do fazer visualizao e jornalismo de dados, estiveram: 1. os
contedos jornalsticos de previso (mtodos para abordar situaes futuras no de
forma especulativa, mas baseadas em dados); 2. a repercusso das peas jornalsticas
(pela sua imprevisibilidade de aceitao e muitas vezes necessidades de ajustes na
busca por melhorias na apresentao e entrega dos dados); 3. o armazenamento e
recuperao de dados (os desafios no processo de arquivamento e resgate dos
contedos. Fato que definitivamente os jornalistas precisam ter mais zelo); 4. a
soluo e validao das peas (atravs do uso de algoritmos e robs em tecnologias
facilitadoras de anlises de grandes conjuntos de dados); 5. a lgica da produo dos
contedos (que impactam nas diferentes maneiras de se trabalhar no ambiente
redacional voltado para a prtica do jornalismo de dados. Falamos aqui do
gerenciamento que envolve o desenvolvimento de peas simultaneamente).

Conclumos que houve um salto na histria, no curso da vivncia em sociedade que


mudou suas formas de estruturas comunicativas, culturais e consequentemente, por se
tratar de um ecossistema, de toda a rede. As mudanas ocorrem em diferentes etapas e
hierarquias e se situar neste meio tornou-se algo extremamente relevante. Houve uma
trajetria, de certa forma linear, do cinema, rdio e TV e agora h o tudo junto e
misturado que envolve essa trajetria. H um retorno, de certa forma, a oralidade que
coincide com a retomada da visualidade como forma de conhecimento. As
construes e apropriaes ocorrem de maneira diversas no havendo regras e nem
caminhos para as produes dos contedos (que tem, entre outros desafios, a
produo em escala). H inmeras experimentaes sejam nos modelos de negcios,
nas narrativas, na interligao comunicao/tecnologia, alm das tendncias de outras
formas de vivncia como realidade aumentada, Internet das coisas, que levam ainda
h outras experimentaes do meio.
193

Consideraes Finais

Neste ecossistema jornalstico, a humanizao dos dados tornou-se elemento


fundamental diante dos processos de mecanizao. O jornalista est entre a multido e
os algoritmos exercendo o papel de um investigador, de um tradutor, de um contador
de histrias. Sendo preciso entender de mtricas e atravessar a barreira da
alfabetizao em estatstica e linguagens de programao. No defendemos que os
jornalistas devam se tornar matemticos ou programadores, mas que podem
compreender alguns sistemas sem a necessidade de uma nova graduao. Sabemos do
desafiador momento pelo qual o jornalismo passa financeiramente e em relao a sua
credibilidade. No jornalismo de dados os desafios no so diferentes, mas preciso,
alm de valor-lo, torn-lo operacionalmente sustentvel no que diz respeito aos
processos de construo das peas que acontecem paralelamente e em uma lgica
diferente das redaes tradicionais. Acreditamos que o perodo experimental da
visualizao de dados precisa ser ultrapassado por aqueles que j a fazem, atentando
para a necessidade dos gerenciamentos de projeto (como assinalado na pgina 176,
em solues e validaes da peas).

Percebemos que preciso dar valor e funcionalidade ao jornalismo retomando


perguntas fundamentais para o exerccio da profisso: o que possvel fazer hoje
melhor do que o jornalismo de modelos anteriores? Que papel o jornalista
desempenha melhor do que ningum? O que os novos atores, softwares, fazem
melhor que os jornalistas? Onde, neste processo, os jornalistas fazem a diferena?
Como o jornalismo pode ser um protagonista da vida das pessoas, ser relevante ao
ponto de justificar o pagamento dos seus produtos e servios? Para ns, a visualizao
de dados se mostrou como um formato que tem processos prprios que dependem dos
dados, das linguagens e ferramentas, locais de armazenamento e formas de resgate e
encontra-se num processo no-linear enraizado na antenarrativa jornalstica. O
jornalismo uma ferramenta, mas no somente tcnica. As questes envolvem
contextualizaes. Deve estar associado ao contexto social e cultural. No
informao primria. A apurao a ferramenta fundamental que justifica a presena
da profisso, que s ter o desenvolvimento da utilidade do contedo com a
compreenso das relaes de poder, as tradues e desvendamentos destas relaes no
mbito social. Acreditamos que o jornalismo de dados e a visualizao de dados so
caminhos que contribuem para a credibilidade e funo social da profisso.

194

Consideraes Finais

Diante destas consideraes, sem respostas conclusivas, defendemos a importncia de


levar estes questionamentos para dentro da universidade. Este cenrio j deve fazer
parte do imaginrio estudantil. Quais as formas de financiamento? Como subsidiar o
jornalismo alm da vontade. Qual o futuro das notcias? o de uma lgica
fragmentada? Ser a recuperao e correlao de dados? preciso encontra o lugar
social do jornalismo, onde os critrios de noticiabilidade e aceitao so outros,
falamos de nichos. Por outro lado, h contedos que parecem no ter valor para um
pblico consumidor, mas que apresentam um valor social relevante para ser discutido
e debatido; como financiar estes contedos? O empreendedorismo jornalstico deve
estar presente, mas antes dele a razo social, valorativa da presena do jornalismo na
sociedade.

195

REFERNCIAS

AGANBEM, Giorgio. O que contemporneo? e outros ensaios. Chapec: Editora


Argos, 2009, 92p.

ALVES, Rafael M. O Ensino de Infografia nos Cursos de Jornalismo das


Universidades do Brasil e da Espanha, 2012. Disponvel em:
https://repositorio.ufsc.br/bitstream/handle/123456789/100425/314908.pdf?sequence
=1. Acesso em: 12 de fevereiro de 2016

AMADEU, Srgio. As polticas da sociedade informacional, propriedade imaterial e


cultura digital. Comunicao & Sociedade. Ano 33, n. 57, p. 59-78, jan./jun. 2012
Disponvel em: https://www.metodista.br/revistas/revistas-
ims/index.php/CSO/article/view/3009/2926. Acesso em: 21 de janeiro de 2015

AMADEU, Srgio; PIMENTEL, Thiago. Geopoltica das redes digitais, Cyberpower


e a militarizao da Internet. In: VIII SIMPSIO NACIONAL DA ABCIBER,
Oficina, So Paulo, dezembro de 2014.

ANDERSON, Chris. BELL, Emily. SHIRKY, Clay. Jornalismo ps-ndustrial


adaptao aos novos tempos, 2012.
http://www.espm.br/download/2012_revista_jornalismo/Revista_de_Jornalismo_ESP
M_5/files/assets/common/downloads/REVISTA_5.pdf

ANDERSON, Chris. BELL, Emily. SHIRKY, Clay. Post-Industrial Journalism -


Adapting to the Present, Tow Center for Digital Journalism, Columbia Journalism
School, 2013. Disponvel em: <http://towcenter.org/research/post-industrial-
journalism> Acesso em: 4 de fevereiro de 2015.

ARAGO, Alexandre. Anlise das redes sociais mostra que perfis falsos
influenciaram discusso na web. Folha de So Paulo. Disponvel em:
http://www1.folha.uol.com.br/poder/2014/09/1524593-analise-das-redes-sociais-
mostra-que-perfis-falsos-influenciaram-discussao-na-web.shtml. Acesso em: 13 de
dezembro de 2014.

BAIRON, Srgio. A Comunicao nas esferas: a experincia esttica e a


hipermdia. Cibercultura: Revista USP, So Paulo. v. 86, p. pp. 18-27, jun/ago,
2010.

BAIRON, Sgio. O que hipermdia. So Paulo: Brasiliense, 2011.

BARBOSA, Suzana. Jornalismo convergente e continuum multimdia na quinta


gerao do jornalismo nas redes digitais. In: CANAVILHAS, Joo. Notcias e
Mobilidade: O Jornalismo na Era dos Dispositivos Mveis. Livros Labcom books,
2013. p. 33-54. www.livroslabcom.ubi.pt.

BARBOSA, Suzana. Jornalismo Digital em Base de Dados: paradigma para


produtos jornalsticos digitais dinmicos. (tese de doutorado) UFBA/POSCOM,
2007. Disponvel em: http://tinyurl.com/nvkxk42. Acesso em: 25 de agosto de 2013.

196

BARBOSA, Suzana; TORRES, Vincius. O paradigma Jornalismo Digital em Base


de Dados: modos de narrar, formatos e visualizao para contedos. Galaxia, So
Paulo. v. 25, 2013, p. p. 152-164, jun. Disponvel em: <Disponvel:
http://tinyurl.com/kmshn9d%u200E> Acesso em: 25 agosto de 2014.

BARIANI, Bruna Barbieri. A importncia da hipermdia como experincia na


produo do conhecimento. (dissertao). ECA/USP, 2013. Disponvel em:
http://www.teses.usp.br/teses/disponiveis/27/27152/tde-12092013-162438/pt-br.php.
Acesso em: 02 de julho de 2014.

BEIGUELMAN, Giselle. Curadoria de contedo o lugar do humano na internet,


2016. Disponvel em: http://noticias.uol.com.br/opiniao/coluna/2016/02/21/curadoria-
de-conteudo-e-o-lugar-do-humano-na-internet.htm. Acesso em: 21 de fevereiro de
2016.

BENCKLER, Yochai. The Wealth of Networks, 2006. Disponvel em:


http://www.benkler.org/Benkler_Wealth_Of_Networks.pdf. Acesso em: 5 de janeiro
de 2016.

BENEVENUTO, Fabrcio. AKMEIDA, Jussara M. SILVA, Altigran, S. Silva.


Explorando redes sociais online: Da coleta e anlise de grandes bases de dados s
aplicaes, 2011. Disponvel em:
http://homepages.dcc.ufmg.br/~fabricio/download/mini-curso-sbrc11.pdf. Acesso em:
30 de setembro de 2014.

BERNERS-LEE, Tim, HENDLER, James & LASSILA, Ora. The Semantic Web,
(2011). Scientific America. Disponvel em: http://www-
sop.inria.fr/acacia/cours/essi2006/Scientific%20American_%20Feature%20Article_%
20The%20Semantic%20Web_%20May%202001.pdf. Acesso em: 20 de julho de
2014.

BERTOCCHI, Daniela. Dos Dados aos Formatos: Um modelo terico para o


design do sistema narrativo no jornalismo digital. (Tese de Doutorado). ECA/USP,
2013. Disponvel em: https://danielabertocchi.com/category/producao/. Acesso em:
01 de junho de 2014.

BERTOCCHI, Daniela; SILVEIRA, Stefanie; CARMARGO, Isadora. Possibilidades


narrativas em dispositivos mveis. In: CANAVILHAS, Joo; SATUF, Ivan.
Jornalismo para Dispositivos Mveis: produo, distribuio e consumo. Livros
Labcom books, 2015. Disponvel em: http://www.livroslabcom.ubi.pt/book/137.
Acesso em: 29 de janeiro de 2016.

BITTENCOURT, Mara. Grounded Theory como metodologia de pesquisa em


Mdias Digitais, 2015. Disponvel em:
http://portalintercom.org.br/anais/nacional2015/resumos/R10-3479-2.pdf. Acesso em:
17 de setembro de 2015.

BONFIM, Marcus Vincius de Jesus. Transparncia e accountability na


comunicao organizacional do setor pblico: impactos da Lei de Acesso
Informao, 2014. Disponvel em:

197

http://www.academia.edu/9981231/Transparncia_e_accountability_na_comunicao
_organizacional_do_setor_pblico_impactos_da_Lei_de_Acesso__Informao.
Acesso em: 22 de janeiro de 2015.

BOUNEGRU, Liliana. CHAMBERS, Lucy. GRAY, Jonathan. Manual de


Jornalismo de Dados, 2012. Disponvel
em: http://datajournalismhandbook.org/pt/index.html. Acesso em 15 de fevereiro de
2014.

BOURDIEU, Pierre. CHAMBOREDON Jean-Claude, PASSERON Jean-Claude. Le


Mtier de Sociologue, Mountoun, Paris-Haia, 1973.

BOURDIEU, Pierre. O Campo Cientfico. In: ORTIZ, Renato. Coleo Grandes


Cientistas Sociais. So Paulo: tica, 1983. p.112-155.

BRADSHAW, Paul. How to be a data journalist, 2010. Disponvel em:


http://www.guardian.co.uk/news/datablog/2010/oct/01/data-journalism-how-to-guide.
Acesso em: 10 de dezembro de 2014.

BRAGA, Jos Luiz. Comunicao, disciplina indiciria. Trabalho apresentado junto


ao GT Epistemologia da Comunicao. Anais do XVI Encontro da Comps.
Universidade Tuiuti do Paran, Curitiba, junho 2007.

BRAMATTI, Daniel. Da fila da impressora ao Basmetro. In: DANTAS, Humberto;


TOLEDO, Jos Roberto de; TEIXEIRA, Marco Antonio Carvalho. Anlise poltica
& jornalismo de dados. Rio de Janeiro: FGV, 2014. p. 219- 226.

CAIRO, Alberto. Alberto Cairo: Data journalism needs to up its own standards,
2014. Disponvel em: http://www.niemanlab.org/2014/07/alberto-cairo-data-
journalism-needs-to-up-its-own-standards/. Acesso em: 10 de julho de 2014.

CAIRO, Alberto. El arte funcional: infografa e visualizacin de informacin.


Madrid: Alamut, 2012.

CAIRO, Alberto. Infografa 2.0: visualizacin interactiva de informacin en


prensa. Madrid: Alamut, 2008.

CAIRO, Alberto. Introduo a visualizao de dados e infografia, 2014.


Disponvel em: https://www.youtube.com/watch?v=I081v2aWGpc. Acesso em: 13 de
abril de 2014.

CAIRO, Alberto. Periodismo de precisin y visualizacin de datos (parte 1),


(2011). Disponvel em: http://blogs.elpais.com/periodismo-con-
futuro/2011/04/periodismo-de-precision-visualizacion-datos.html. Acesso em: 20 de
maro de 2014.

CANAVILHAS, Joo. O novo ecossistema meditico, 2010. Disponvel em:


http://www.bocc.ubi.pt/pag/canavilhas-joao-o-novo-ecossistema-mediatico.pdf.
Acesso em: 27 de janeiro de 2015.

198

CARD, Stuart; MACKINLAY, Jock; SHNEIDERMAN, Ben Readings in


information visualization: using vision to think. San Francisco: Morgan Kaufmann
Publishers, 1999.

CASE, Amber. We are all cyborgs now, 1999. Disponvel em:


https://www.ted.com/talks/amber_case_we_are_all_cyborgs_now. Acesso em: 27 de
junho de 2014.

CASTELLS, Manuel. Internet e sociedade em rede, In: MORAES, Dnis (org.). Por
Uma Outra Comunicao. Rio: Record, p. 255 a 287, 2003.

CHARAUDEAU, Patrick. Discurso das Mdias. Traduo de Angela M. S. Corra.


2. Ed., So Paulo: Contexto, 2012.

COHEN, Louis; MANION, Lawrence; MORRISON, Keith (2007). Research


Methods in Education. Disponvel em:
http://knowledgeportal.pakteachers.org/sites/knowledgeportal.pakteachers.org/files/re
sources/RESEARCH%20METHOD%20COHEN%20ok.pdf. Acesso em: 20 de
novembro de 2015.

COSTA, Caio T. Um modelo de negcio para o jornalismo digital. Como os


jornais devem abraar a tecnologia, as redes sociais e os servios de valor
adicionado. Revista de Jornalismo ESPM, n. 9, p. 51 a 115, 2014. Disponvel em:
http://www.espm.br/download/2012_revista_jornalismo/Revista_de_Jornalismo_ESP
M_9/. Acesso em: 08 de agosto de 2014.

COX, Donna. Metaphoric mappings: the art of visualization. In: FISHWICK, Paul.
(org.) Aesthetic Computing. Cambridge, Mass.: MIT Press, 2006.

CRUCIANELLI, Sandra. Herramientas Digitales para el Periodismo de Datos,


2014. Curso massivo e aberto University of Texas at Austin em parceria com o
Knight Center Jounalism in the Americas. Realizado entre os dias 18 de agosto e 21
de setembro de 2014. Disponvel em: https://knightcenter.utexas.edu/es/blog/00-
15690-como-usar-herramientas-del-periodismo-de-datos-inscribete-ahora-nuevo-
curso-en-linea-g.

DELEUZE, Gilles. Que s un dispositivo? In: Michel Foucault, filsofo.


Barcelona: Gedisa, 1990. pp. 155 - 163. Disponvel em:
http://www.psi.uba.ar/academica/carrerasdegrado/psicologia/sitios_catedras/practicas
_profesionales/812_clinica/cursada/archivos/deleuze_que_es_un_dispositivo.pdf

ENTINI, Carlos Eduardo. Quem arquivar a internet para as futuras geraes?,


2013. Disponvel em: http://acervo.estadao.com.br/noticias/acervo,quem-arquivara-a-
internet-para-as-futuras-geracoes,9215,0.htm. Acesso em: 22 de fevereiro de 2016.

ESPERANA, Claudio. Visualizao de dados: pesquisa e prtica #CPBR8, 2014.


Palestra ministrada no Campus Party, palco Vnus, dia 07 de fevereiro de 2015.
Disponvel em: http://campuse.ro/events/campus-party-brasil-2015/talk/palestra-
visualizacao-de-dados-pesquisa-e-pratica-cpbr8/. Acesso em: 07 de fevereiro de 2015.

199

ESTEVANIM, Mayanna. Visualizao de Dados Complexos no Jornalismo


Digital: uma reflexo sobre os conceitos de dispositivo, 2014. Disponvel em:
http://www.intercom.org.br/papers/nacionais/2014/resumos/R9-0440-1.pdf. Acesso
em: 01 de setembro de 2014.

FELDMAN, Tony. Multimedia. London: Blueprint, 1995.

FERREIRA, Jairo. Uma abordagem tridica dos dispositivos miditicos, 2006.


Disponvel em:
http://www.revistas.univerciencia.org/index.php/libero/article/viewFile/6112/5572.
Acesso em: 20 de novembro de 2013.

FEW, Stephen. Abelas Folly A Thought Confuser, 2015. Disponvel em:


https://www.perceptualedge.com/blog/?p=2080 - Abelas Folly A Thought
Confuser. Acesso em: 20 de janeiro de 2016.

FEW, Stephen. Now you see it: simple visualization techniques for quantitative
analysis. Oakland: Analytics Press, 2009.

FLUSSER, Vilm. O mundo codificado: por uma filosofia do design e da


comunicao. Org. Rafael Cardoso. Trad. Raquel Abi-Smara. So Paulo: Cosac
Naify, 2007.

FOUCAULT, Michael. Microfsica do poder. 8. ed. Rio de Janeiro: Graal, 1979.

FREITAS, Rosiane C. PINTO, Renata M. Programao de Alto Nvel no


Jornalismo de Dados, 2015. Disponvel em
http://portalintercom.org.br/anais/nacional2015/resumos/R10-3036-2.pdf. Acesso em
12 de dezembro de 2015.

GABRIEL, Martha. Aula inaugural. Digicorp (ECA/USP). 01 de fevereiro de 2012.


Notas de aula.

GABRIEL, Martha. Marketing na era digital: conceitos, plataformas e estratgias.


So Paulo: Novatec, 2010.

GIANNELLA, Julia. R. Dispositivo infovis: interfaces entre visualizao da


informao, infografia e interatividade em stios jornalsticos, 2014. 189 f.
Dissertao (Mestrado) Escola de Comunicaes e Artes, Universidade de So
Paulo.

GIL, Antnio Carlos. Como elaborar projetos de pesquisa, 2002. So Paulo: Atlas.
Disponvel em: http://tinyurl.com/pcvp6r6. Acesso em 29 de setembro de 2013.

GIL, Antnio Carlos. Mtodos e tcnicas de pesquisa social. 4. ed. So Paulo: Atlas,
1994.

GLASSER, Barney; STRAUSS, Anselm. The Discovery of Grounded Theory:


strategies for qualitative research. Chicago/Nova York: Aldine de Gruyter,1967.

200

GORDILLO, Mara Del Mar Garca; VALENCIA, Ofa Bezunartea; CRUZ, Ins
Rodrguez. El Valor Agregado Periodistico, herramienta para el periodismo de
calidad. In: MONPART, Josep L. Gmez; LOZANO, Juan F. Gutirrez; SAMPIO,
Dolors Palau (Org.). Investigar la Comunicacin hoy Revisin de polticas
cientficas y aportaciones metodolgicas, 2013. Disponvel em:
https://uvadoc.uva.es/bitstream/10324/3032/1/MetodosYTecnicasDeAnalisisYRegistr
oParaInvestigar.pdf. Acesso em: 10 de outubro de 2014.

GORDON, Rich. Data as journalism, journalism as data, 2007. Disponvel em:


http://tinyurl.com/q8a9ho6. Acesso em: 10 de agosto de 2013.

GRANDO, Carolina Pompeo. Os dispositivos que constituem o dispositivo, 2012.


Disponvel em:
http://www.observatoriodaimprensa.com.br/news/view/_ed711_os_dispositivos_que_
constituem_o_dispositivo. Acesso em: 03 de dezembro de 2013.

GREY, Jonathan. BOUNEGRU, Liliana. CHAMBERS, Lucy. Manual de


Jornalismo de Dados, 2012. Disponvel em: http://datajournalismhandbook.org/pt/.
Acesso em: 17 de novembro de 2015.

GUIMARES, Luciano. A cerca do Jornalismo Visual: busca pela delimitao da


investigao das imagens no jornalismo, (2012). Disponvel em:
http://www.intercom.org.br/papers/nacionais/2012/resumos/R7-2382-2.pdf. Acesso
em: 4 de setembro de 2013.

HASWANI, Maringela Furlan. Comunicao governamental: em busca de um


alicerce terico para a realidade brasileira. In: Revista Organicom Dossi
Comunicao Pblica e Governamental. So Paulo: Gestcorp ECA-USP, Ano 3, n. 4,
1 semestre, 2006.

IANNI, Octavio. Globalizao: novo paradigma das cincias sociais. Revista


Estudos Avanados, So Paulo: USP/IEA, Vol. 8, no. 21, 1994.

JANSEN, Thiago P. Data-driven Journalism: o uso e a visualizao de base de


dados na produo jornalstica, 2011. Disponvel em:
https://literaturaexpandida.files.wordpress.com/2011/09/monografia-final.pdf. Acesso
em: 27 de agosto de 2013.

JENKINS, Henry. Cultura da Convergncia. So Paulo: Aleph, 2009.

JENKINS, Henry, FORD, Sam e GREEN, Joshua. Spreadable Media: Creating


Value and Meaning in a Networked Culture. New York: NYU Press, 2013.

JENSEN, Klaus B.; JANKOWSKI, Nicholas W. Metodologas cualitativas de


investigacin en comunicacin de masas. Barcelona: Bosch, cap. 2. p. 52 a 232,
1993.

JENSEN, Klaus B. Teoria e Filosofia da Comunicao. Revista Matrizes. Ano 2, n.


1, p. 31-49, 2008.

201

JOHNSON, Steven. O mapa fantasma: como a luta de dois homens contra o


clera mudou o destino de nossas metrpoles. Rio de Janeiro: Zahar, 2008.

KLEIN, Otavio Jos. A gnese do conceito de dispositivo e sua utilizao nos


estudos miditicos, 2007. Disponvel em: http://www.ec.ubi.pt/ec/01/pdfs/klein-
otavio-genese-do-conceito-de-dispositivo.pdf. Acesso em: 11de novembro de 2013.

KOSARA, Robert. Stories Are Gateways Into Worlds. Eager Eyes: Visualization
and Visual Communication, 2014. Disponvel em:
<!http://eagereyes.org/blog/2014/stories-are-gatewaysinto-worlds>. Acesso em: 13 de
abril de 2014.

KOSARA, Robert. Tableau Public. Eager Eyes: Visualization and Visual


Communication, 2010. Disponvel em: <http://eagereyes.org/blog/2010/tableau-
public>. Acesso em: 11 de fevereiro de 2014.

LANDOW, George. Hipertexto 3.0, teoria crtica y nuevos mdios en la era de la


globalizacin. Barcelona: Paids Ibrica, 2009.

LEITE, Edmundo. Datalizao o desafio na era da digitalizao, 2013.Disponvel


em: http://acervo.estadao.com.br/noticias/acervo,datalizacao-e-o-desafio-na-era-da-
digitalizacao,9285,0.htm. Acesso em: 5 de dezembro de 2015.

LEITE, Edmundo. Entrevista concedida a Mayanna Estevanim, em visita ao Acervo


(no gravada). Dia 17 de novembro de 2015.

LIMA, Edvaldo P. O jornalismo impresso e a teoria geral dos sistemas: um


modelo didtico de abordagem . Dissertao de Mestrado. Escola de Comunicaes
e Artes da Universidade de So Paulo, 1981.

LOPES, Maria Immacolata V. Pesquisa em comunicao. So Paulo: Loyola, 11


ed., 2010.

LORENZ, Mirko. Status and Outlook for a data-driven journalism. Data driven
journalism: What is there to learn?, 2010. Amsterd: European Journalism Centre.
Disponvel em: http://pt.slideshare.net/duarteromero/datadriven-journalism-what-is-
there-to-learn-12056926. Acesso em: 15 de dezembro de 2014.

MACHADO, Irene. Comunicao de snteses em perspectiva semitico-evolutiva:


modelizao de linguagens, de formatos, do signo informtico, de
temporalidades, 2010. Disponvel em:
http://webcache.googleusercontent.com/search?q=cache:7vpMuOsV-
_kJ:revistas.unisinos.br/index.php/fronteiras/article/view/4670/1893+&cd=1&hl=en&
ct=clnk&gl=br. Acesso em: 6 de fevereiro de 2016.

MACHADO, Irene. Escola de semitica: a experincia de Trtu-Moscou para o


estudo da cultura, So Paulo: FAPESP/ Ateli Editorial, 2003.

MACHADO, Irene. Gneros e/ou formatos? Design de linguagem mediada.


Congresso Brasileiro de Cincias da Comunicao, Santos, SP, 2007.

202

MANOVICH, Lev. Data stream, database, timeline . Softwares Studies, 2012.


Disponvel em:<http://lab.softwarestudies.com/2012/10/data-stream-database-
timeline-new.html> Acesso em: 10 de junho de 2014.

MANOVICH, Lev. Data Visualisation as New Abstraction an Anti-Sublime, 2002.


Disponvel em <http://www.manovich.net>. Acesso em: 10 de setembro de 2013.

MANOVICH, Lev. El linguaje de los nuevos meios de comunicacin. La imagen en


la era digital, 2006. Disponvel em:
https://uea1arteycomunicacion.files.wordpress.com/2013/09/manovich-el-legunaje-
de-los-nuevos-medios.pdf. Acesso em: 25 de novembro de 2013.

MANOVICH, Lev. Visualizao de dados como uma nova abstrao e anti-sublime.


In: LEO, Lucia. (org.). Derivas: cartografias do ciberespao. So Paulo:
Annablume, 2004.

MARTN-BARBERO, Jess. Uma aventura epistemolgica. Matrizes, v. 2, n. 2, p.


143-162, 2009b. Entrevista concedida Maria Immacolata Vassalo de Lopes.

MARTINS, Gilberto Andrade. Estudo de caso: uma reflexo sobre a


aplicabilidade em pesquisas no Brasil, 2008. Disponvel em:
http://www.revistasusp.sibi.usp.br/pdf/rco/v2n2/02.pdf. Acesso em: 10 de agosto de
2012.

MEDITSCH, Eduardo. O jornalismo uma forma de conhecimento?, 1997.


Disponvel em: http://www.bocc.ubi.pt/pag/meditsch-eduardo-jornalismo-
conhecimento.pdf. Acesso em: 26 junho de 2014.

MEYER, Philip. Precision journalism: a reporters introcuction to social Science


methods. Bloomington: Indiana University Press, 1973.

MEYER, Philip. The future of CAR: declare Cictory and Get Out. In: When nerds
and words collide: reflections on the development of Computer Assisted
Reporting. So Petesburgo: The Poyter Institute or Media Studies, 1999. Disponvel
em: http://studylib.net/doc/8012136/the-future-of-car---the-university-of-north-
carolina-at-c...Acesso em: 13 de setembro de 2015.

MEYER, Philip. The new precision journalism. Bloomington: Indiana University


Press, 1991.

MIGE, Bernard. Sete Consideraes fundamentais sobre o espao pblico


contemporneo. In: SOUSA, Mauro Wilton de. CRREA, Elizabeth Saad (orgs.).
Mutaes no espao pblico contemporneo So Paulo: Paulus, 2009.

MIELNICZUK, Luciana. Jornalismo na web: uma contribuio para o estudo do


formato da notcia na escrita hipertextual. Tese (Doutorado) UFBA, Salvador,
2003. Disponvel em: < http://www.scribd.com/doc/12769270/Jornalismo-na-web-
uma-contribuicao-para-o-estudo-doformato-da-noticia-na-escrita-hipertextual>.
Acesso em: 10 julho de 2014.

203

MONPART, Josep L. Gmez; LOZANO, Juan F. Gutirrez; SAMPIO, Dolors Palau


(Org.) (2013). La calidad periodstica: Teoras, investigaciones y sugerencias
profesionales. Coeditores: Universitat Autnoma de Barcelona, Universitat Jaume I,
Universitat Pompeu Fabra: Aldea Global

MORIN, Edgar. O paradigma complexo. In: Introduo ao pensamento complexo.


Porto Alegre: Sulina, p. 57 a 77, 2006.

MOUILLAUD, Maurice e PORTO, Sergio Dayrell. O jornal: da forma ao sentido.


Braslia: Paralelo, 1997.

PALCIOS, Marcos. MACHADO, Elias. Modelos de jornalismo digital. Salvador,


Calandra, 2003.

PINK, Sarah. The Future of Antropology: engaging the senses. London and New
York: Routledge, 2006.

PIREDDU, Mario. A carne do futuro utopia da desmaterializao. In: Ps-


Humanismo: As Relaes entre o Humano e a Tcnica na poca das Redes. So
Caetano do Sul: Difuso Editora, 2010.

PIRES, Nuno M. O que a cincia de dados e porqu ela importante para o seu
negcio. Ecommerce Brasil, 2014. Disponvel em:
http://www.ecommercebrasil.com.br/artigos/o-que-e-ciencia-de-dados-e-porque-ela-
e-importante-para-o-seu-negocio/. Acesso em: 1 de janeiro de 2015.

PORTAL IMPRENSA. Jornalistas usam novas ferramentas para filtrar boas


pautas no universo Big Data, 2015. Disponvel: Disponvel em:
http://www.portalimprensa.com.br/especialtecnologia/conteudo_tecnologia_09.asp.
Acesso em 05 denovembro de 2015.

QUIGLEY, Aaron. Aesthectics of large-scale relational information visualization in


practice. In FISHWICK, Paul. (org.) Aesthetic Computing. Cambridge, Mass.: MIT
Press, 2006.

RAMALHO, Luciano. Python: linguagem de programao. 25 de maio de 2015.


Notas de aula (disciplina de Jornalismo On-line, ECA/USP).

RAMOS, Daniela Osvald. Formato: condio para a escrita do Jornalismo Digital


em Bases de Dados. Uma contribuio da semitica da cultura. (Tese de
Doutorado). ECA/USP, 2011. Disponvel em: http://tinyurl.com/pxgm5vy. Acesso
em: 27 de agosto de 2013.

RAMOS, Daniela; SPINELLI, Egle; ESTEVANIM, mMyanna. Formatos digitais e


qualidade no jornalismo brasileiro em base de dados, 2014. Disponvel em:
https://cobciber4.files.wordpress.com/2015/04/cobciber4atas.pdf. Acesso e, 2 de
junho de 2015.

RAMOS, Daniela Osvald. Os textos digitais e seus sistemas modelizantes, 2012.


Disponvel em: http://tinyurl.com/o5l5n7f. Acesso em: 27 de agosto de 2013

204

RAPAZOTE, Joo. Antropologia e documentrio: da escrita ao cinema, 2007.


Disponvel em: http://www.doc.ubi.pt/03/artigo_joao_rapazote.pdf. Acesso em: 02 de
julho de 2014.

RECUERO, Raquel. A Conversao em Rede. Porto Alegre: Sulina, 2012.

RECUERO, Raquel. Mtricas de Centralidade e Conversaes em Redes Sociais


na Internet: Desvelando Estratgias nos Debates Presidenciais de 2014, 2014.
Disponvel em: http://www.raquelrecuero.com/artigos/abciberfinal2014.pdf. Acesso
em: 10 de dezembro de 2014.

RECUERO, Raquel. Redes Sociais Na Internet. 2 Ed Porto Alegre: Sulina.


(Coleo Cibercultura), 2011.

RIBEIRO, Daniel Melo. Visualizao de dados na Internet. Dissertao (Mestrado


em Tecnologias da Inteligncia e Design Digital) Pontifcia Universidade Catlica
de So Paulo, So Paulo, 2009.

ROAM, Dan (2008). The Back of the Napkin: Solving Problems and Selling Ideas
with Pictures. New York: Penguin Books, 2008.

RODRIGUES, Adriana A. Infografia em base de dados no jornalismo digital,


(2009). Dissertao (mestrado) - FACOM, UFBA, Salvador.

RODRIGUES, William C. Metodologia Cientfica, 2007. Disponvel em:


http://professor.ucg.br/SiteDocente/admin/arquivosUpload/3922/material/Willian%20
Costa%20Rodrigues_metodologia_cientifica.pdf. Acesso em: 09 de agosto de 2014.

SAAD, Elizabeth. BERTOCCHI, Daniela. A cena cibercultural do jornalismo


contemporneo: web semntica, algoritmos, aplicativos e curadoria, 2012.
Disponvel em: http://www.matrizes.usp.br/index.php/matrizes/article/view/340
Acesso em: 5 de junho de 2013.

SAAD, Elizabeth. Centralidade, transversalidade e resilincia: reflexes sobre as


trs condies da contemporaneidade digital e a epistemologia da Comunicao,
2015. Disponvel em:
http://www.academia.edu/11668397/Centralidade_transversalidade_e_resiliencia_refl
ex%C3%B5es_sobre_as_tr%C3%AAs_condi%C3%A7%C3%B5es_da_contemporan
eidade_digital_e_a_epistemologia_da_Comunica%C3%A7%C3%A3o. Acesso em:
05 de maio de 2015.

SAAD, Elizabeth. Estratgias 2.0 para a mdia digital. Internet, informao e


comunicao. So Paulo: Editora Senac, 2003.

SAAD, Elizabeth. Estratgias 2.0 para a mdia digital. Internet, informao e


comunicao. So Paulo: Editora Senac, 2008.

SAAD, Elizabeth. Estratgias de contedo para meios digitais. In: QUADROS,


Claudia; CAETANO, Kati & LARANGEIRA, lvaro (Orgs.), 2011. Jornalismo e

205

Convergncia: ensino e prticas profissionais. Disponvel em:


<http://www.livroslabcom.ubi.pt/book/21> Acesso em: 22 de outubro de 2014.

SAAD, Elizabeth. Quem Mexeu No Meu Jornalismo? Palestra realizada pela


Faculdade Csper Lbero. Disponvel em: http://casperlibero.edu.br/assista-ao-vivo-
quem-mexeu-no-meu-jornalismo/. Acesso em: 08 de maio de 2014.

SAAD, Elizabeth. Reflexes para uma epistemologia da Comunicao Digital,


2008. Universidade de So Paulo. Disponvel em: http://tinyurl.com/qbrb5mu. Acesso
em: 25 de julho de 2013.

SAAD, Elizabeth. Uma reconfigurao cultural possvel e vivel. Revista Matrizes,


Ano 7 n 1 jan./jun, 2013.

SANTAELLA, Lucia. Comunicao ubqua: repercusses na cultura e na


educao. So Paulo, Ed. Paulus, 2013.

SANTAELLA, Lucia. Matrizes da linguagem do pensamento: sonora, visual,


verbal. 3. ed. So Paulo: Iluminuras: FAPESP, 2005.

SANTOS, Boaventura de Sousa. Introduo a uma cincia ps-moderna. Rio de


Janeiro: Graal, p. 121 a 161, 1989.

SAUDO, Andria. SALA, Lia Geovana. Metodologia Cientfica (2008). Disponvel


em:http://soniaa.arq.prof.ufsc.br/arq1001metodologiacinetificaaplicada/met2008/yin.p
df. Acesso em: 10 de agosto de 2012.

SAUSSURE, Ferdinand de. Curso de lingustica geral. 27a Ed. So Paulo: Cultrix,
2006.

SCOLARI, Carlos. As interfaces no desaparecem, transformam-se. Revista USP


n. 86, Coordenadoria de Comunicao Social, Universidade de So Paulo,
Julho/Julho/Agosto, 2010.

SCOLARI, Carlos. Hipermediaciones. Elementos para una teora de la


Comunicacin interactiva, 2008. Barcelona: Gedisa, p. 29 a 118.

SERRA, Joaquim. Manual de Teoria da Comunicao. Labicom, Covilh, 2007.

SERRES, Michel. Ramos. Rio de Janeiro, Bertrand Brasil, 2008.

SHANNON, Claude. WEAVER, Warren. The mathematical theory of


communication. Chicago: University of Illinois Press, 1949.

SHEDROFF, Nathan. Information interaction design: a unified field theory of design.


InJACOBSON, Robert (org.). Information Design. London: MIT Press, 1999.

SLOTERDIJK, Peter, Esferas III, Espumas, Editorial Siruela, Barcelona, 2006.

SOUZA, Isis C. BUENO, Renato. Anlise da Evoluo Temporal de Dados

206

Complexos, 2013. . Disponvel em:


http://sbbd2013.cin.ufpe.br/Proceedings/artigos/pdfs/sbbd_wtd_05.pdf. Acesso em:
20 de janeiro de 2015.

STEARNS, Josh. The Best Online Storytelling and Journalism of 2014, 2014.
Groundswell. Disponvel em: http://stearns.wordpress.com/2015/01/05/the-best-
online-storytelling-and-journalism-of-2014/. Acesso em: 12 de janeiro de 2015.

TAKAI, Osvaldo K. ITALIANO, Isabel C. FERREIRA, Joo E.. Introduo a


Banco de Dados. DCC-IME-USP, 2005. Disponvel em:
http://www.ime.usp.br/~jef/apostila.pdf. Acesso em: 5 de agosto de 2013.

TAROZZI, Massimiliano. O que grounded theory: metodologia de pesquisa e de


teoria fundamentada nos dados. Ed: Vozes, Petrpolis/RJ, 2011.

TEIXEIRA, Carla Cristina C.. Criatividade, Design Thinking e Visual Thinking e


sua relao com o universo da infografia e da visualizao de dados. Rio de
Janeiro, 2014. 196p. Tese de Doutorado - Departamento de Artes & Design,
Pontifcia Universidade Catlica do Rio de Janeiro.

THIOLLENT, Michel. Crtica metodolgica, investigao social e enquete


operria. So Paulo: Polis, caps. I e II, 1980.

THOM, Clarissa. Jornalistas do Estado recebem no Rio prmio Esso de


jornalismo, (2015). Disponvel em:
http://politica.estadao.com.br/noticias/geral,jornalistas-do-estado-recebem-no-rio-
premio-esso-de-jornalismo,10000001888. Acesso em: 14 de novembro de 2015.

TIMPONI, Raquel. What we will, narrativas em loop e o cinema como


software: um olhar mais simplista para o cinema participativo, (2008).
Disponvel em: https://www.yumpu.com/pt/document/view/12664180/what-we-will-
narrativas-em-loop-eo-cinema-como-software-cencib. Acesso em: 30 de junho de
2014.

TOLEDO, Jos Roberto de. Entrevista concedida a Mayanna Estevanim, em visita


a redao do blog Estado Dados (no gravada). Dia 17 de novembro de 2015.

TOLEDO, Jos Roberto de.. Entrevista concedida a Mayanna Estevanim


(gravada). Dia 01 de maro de 2016.

TOLEDO, Jos Roberto de. Pirando nos dados - prefcio. In: DANTAS, Humberto;
TOLEDO, Jos Roberto de; TEIXEIRA, Marco Antonio Carvalho. Anlise poltica
& jornalismo de dados. Rio de Janeiro: FGV, 2014. p. 7 10.

TRSEL, Marcelo. Jornalismo Guiado por Dados: relaes da cultura hacker


com a cultura jornalstica, 2013. Disponvel em:
http://compos.org.br/data/biblioteca_2065.pdf. Acesso em 30 de junho de 2014.

207

TRIVINHO, Eugnio R.. Obliterao estrutural da esfera pblica no ciberespao. In:


SOUSA, Mauro Wilton de. CRREA, Elizabeth Saad (orgs.). Mutaes no espao
pblico contemporneo So Paulo: Paulus, 2014.

TUFTE, Eduard. Envisioning Information. Cheshire: Graphics Press, 1990.


TUFTE, Eduard. The Visual Display of Quantitative Information. Cheshire:
Graphics Press, 1983.

VATTIMO, Gianni. Sociedade transparente. Lisboa: Relgio Dgua Editores,


1992.

WEISS, Jessica. Como o ICIJ fez uma investigao transfronteiria, colaborativa


e em grande escala, 2015. Disponvel em: https://ijnet.org/pt-br/blog/como-o-icij-
fez-uma-investiga%C3%A7%C3%A3o-transfronteiri%C3%A7a-colaborativa-e-em-
grande-escala. Acesso em: 10 de janeiro de 2016.

WIENER, Norbert. The human use of human beings: cybernetics and society.
Cambridge, Mass.: MIT Press, 1960.

WIENER, Norbert. Ciberntica e Sociedade: O Uso Humano dos Seres Humanos.


Traduo de Jos Paulo Paes, So Paulo: Cultrix, 1970

WRIGHT, Alex. The Secret History of Hypertext. The conventional history of


computing leaves out some key thinkers, 2014. Disponvel em:
http://www.theatlantic.com/technology/archive/2014/05/in-search-of-the-proto-
memex/371385/. Acesso em 30 de junho de 2014.

YIN, Robert K. Estudo de Caso: Planejamento e Mtodos. 2. ed. Porto Alegre:


Bookman, 2001.

208

Você também pode gostar