BUZATO - Data Storytelling Genero Bastardo

Gênero reloadinG
BUZATO, Marcelo. Data Storytelling e a dadificação de tudo: um gênero bastardo de mãe narrativa e pai banco de dados. In:
LIMA-LOPES, R. E. DE; BUZATO, M. E. K. (Org.). Gênero Reloading. Campinas, SP: Potes Editores, 2018. p. 95–123.
DATA STORYTELLING E A DADIFICAÇÃO DE TUDO:

UM GÊNERO BASTARDO DE MÃE NARRATIVA E PAI
BANCO DE DADOS
Marcelo El Khouri Buzato

Universidade Estadual de Campinas
Resumo
A dadificação é o processo pelo qual volumes extraordinários

de dados têm sido obtidos por empresas e governos via monito-
ramento e sensoriamento do cotidiano das pessoas. Essa massa
heterogênea ganha significado (vira informação) a partir do trabalho
estatístico convertido em representações visuais chamadas visu-
alizações e/ou narrativas de dados. Neste capítulo, caracterizo as
visualizações e narrativas de dados por referência aos métodos e
pressupostos ontológicos e epistemológicos do quantitativismo.
Após mostrar que o enquadre desses objetos semióticos nas teorias
de gêneros discursivos é problemático, a despeito do seu caráter
retórico e enunciativo-discursivo vir paulatinamente ganhando re-
conhecimento, proponho que uma forma de estudar visualizações
e narrativas de dados como gêneros discursivos é caracterizá-las
como gêneros híbridos de narrativa e banco de dados.
95
Gênero reloadinG
0. INTRODUÇÃO
Há muito, os estudos da linguagem no campo aplicado têm

se preocupado com o fenômeno sociotécnico da digitalização,
isto é, o processo de transformação de átomos em bits, como o
definiu Nicolas Negroponte (1995). A partir dos estudos iniciais
sobre hipertexto e multimídia, abordagens teóricas como as dos
estudos do letramento e dos gêneros discursivos foram sendo
direcionadas a esses novos objetos e práticas, permitindo o surgi-
mento de construtos como letramentos digitais e gêneros digitais.
Contudo, enquanto ainda tentávamos compreender tais práticas e
objetos, uma segunda revolução estava em curso: a do casamento
da digitalização com a atividade muito mais antiga1 de quantificar
o mundo para desvendá-lo, ou seja, a dadificação.
Primariamente, dadificar é “traduzir em dados aspectos do
mundo não quantificados previamente” (Kennedy et al, 2015, p.1,
minha tradução). Fosse o fenômeno realmente tão prosaico quanto
essa primeira definição, não haveria nada a pesquisar acerca dele.
Ocorre que a dadificação não é mais a mesma, desde que ela passou
a ser operacionalizada por um tipo de computação ubíqua, móvel,
locativa e em nuvem e cognitiva, i.e. capaz, de mimetizar com alta
velocidade certos tipos de raciocínio humano.
Assim como a digitalização, a dadificação do mundo também
se instancia em objetos semióticos participantes de práticas socio-
discursivas específicas. Destaco entre tais objetos, neste capítulo,
as visualizações de dados (doravante, VDs), que, nascidas em labo-
ratórios, agora se ambientam em esferas como a do jornalismo, a
dos negócios, a do governo e, claro, da educação (Cope & Kalantzis,
2016). A Figura 1, por exemplo, mostra uma VD jornalística que
permite ao leitor saber qual era a taxa de homicídios em todos os
munícipios do Brasil por volta do ano de 2010, identificando os
1 A dadi caç o nasce por volta do S c. III, quando astrônomos, ge grafos e navegadores co-
meçam a quanti car o espaço e o tempo de forma cada ve mais precisa. A digitali aç o veio a
tornar o trabalho com dados exponencialmente mais abrangente e e ciente (Mayer-Schönberger
& Cukier, 2013).
96
Gênero reloadinG
“picos” numéricos visualmente com as regiões correspondentes

no mapa do País.
Figura 1 - Mapa da violência no Brasil por volta de 2010

Fonte: Adaptado de Estadão Infográficos (2010)
Brandão (2018) entende que é papel desse tipo de jornalismo

menos fornecer ao leitor o conhecimento necessário para decodifi-
car e apreciar formas científicas de representação da realidade do
97
Gênero reloadinG
capacitar o cidadão a “compreender, questionar e, quando neces-

sário, confrontar a ciência com suas enormes implicações éticas
e político-sociais”. Para isso, é necessário que encontremos ferra-
mentas teóricas e pedagógicas que permitam interpelar as VDs e
suas tributárias, as narrativas de dados (doravante, NDs), não como
retratos matemáticos do real, mas como os construtos retóricos
e enunciativo-discursivos que são. Daí tentarmos caracterizá-las
como gêneros.
Neste capítulo, discuto os limites e possibilidades de um
enquadre das VDs e NDs como gêneros discursivos. Inicialmente,
caracterizo a dadificação enquanto conceito, prática e visão de
mundo. Em seguida, trato do funcionamento semiótico e político
das VDs e NDs e das ambiguidades e conflitos metalinguísticos
que as envolvem hoje. Para finalizar, busco no conceito de trans-
codificação cultural de Lev Manovich (2001) uma alternativa para
o tratamento de VDs e NDs enquanto gêneros híbridos.
1. DADIFICAÇÃO: O QUE É E COMO FUNCIONA
Filosoficamente, um dado é justamente algo “dado”, ou seja,

que pode ser demonstrado como sendo um fato2. Tecnicamente, o
dado é uma sequência de símbolos quantificados ou quantificáveis,
uma entidade puramente sintática. Já a informação é uma abstração
que tem conteúdo semântico, um dado que representa algo signi-
ficativo pela intermediação de um signo. Por fim, o conhecimento
envolve a experiência, que agrega um componente pragmático à
informação. Assim, um clarão no meio da noite é o dado, “relâm-
pago” é a informação e tampar os ouvidos à espera de um trovão
é conhecimento. Daí que VDs e NDs sejam, primariamente, signos
que permitem a transformação de dados em informação, para fins
epistêmicos.
2 Em sua obra “Os Dados”, escrita por volta de 300 AC, Euclides chama de dado um conjunto
de partes ou relações de uma gura plana tal que, faltando uma, mas tendo-se as demais, a
faltante já está determinada.
98
Gênero reloadinG
Podemos, agora, (re)definir dadificação como uma atividade

epistêmica que consiste em registrar e mensurar as mais diversas
dimensões da natureza (inclusive do comportamento humano),
gerando dados que, mediante operações estatísticas humanas e
não humanas, revelem informações e modelos preditivos capazes
de gerarem valor (econômico ou de outra natureza) para alguém.
No quotidiano das pessoas, a dadificação se instancia de vá-
rias formas. Está em curso quando fazemos buscas no Google ou
postamos uma foto com geotag em mídias sociais, mas também,
quando caminhamos desapercebidos pela cidade sendo filmados
ou rastreados via nossos próprios smartphones. Ela atua quando
obtemos um desconto na farmácia em troca de nosso CPF, mas
também quando, gratuitamente, ajudamos fabricantes de sistemas
operacionais a melhorarem seus serviços de geolocalização mo-
nitorando conexões de wifi que usamos. Um simples smartphone
gera dez tipos de dados que podem ser traduzidos em informações
sobre dezesseis tipos de comportamento humano (Harari et al,
2016). Multiplicando-se essa quantidade de dados pela quantida-
de de usuários e pelo número de aplicativos e contas utilizadas,
chegamos a alguns petabytes3 de dados por hora.
Essa massa de dados vale muito mais do que o cidadão co-
mum suspeita, sendo que o valor econômico gerado é diretamente
proporcional à quantidade de facetas do comportamento huma-
no exploradas dessa forma. Por isso o aforismo de Clive Humby
(Palmer, 2006) tornou-se o mantra da dadificação: “os dados são
o novo petróleo”!
Particularmente relevante, para os que estudam linguagem em
uso, é a dadificação das nossas interações sociais e experiências
subjetivas. O Facebook, por exemplo, dadifica nossos relacionamen-
tos visando construir sociogramas4; o LinkedIn, nossa experiência
3 Um petabyte é igual a 1 megabyte elevado à quinta pot ncia, ou 1.000.000.000.000.000 bytes.
4 Um sociograma é uma representação dos vínculos estabelecidos entre participantes de de-
terminado grupo social. Pode ser construído em forma de matriz matemática ou de um grafo
(rede constituída por nós representando indivíduos e arestas representando laços). Utiliza-se
sociograma para caracterizar o funcionamento de grupos e papeis de seus participantes em
99
Gênero reloadinG
profissional, para gerar “talentogramas” (talent graphs); o Twitter

dadifica nossos humores e inclinações emocionais (Mayer-Schön-
berger & Cukier, 2013). Cada rede social, aplicativo ou sistema
operacional que utilizamos, dadifica algo de nós.
Empresas de crédito usam sociogramas para determinar se
somos bons pagadores, independentemente das selfies sugestivas
que tiramos, mas a partir dos laços que mantemos com outros
bons ou maus pagadores (“diz-me com quem tu andas e dir-te-ei
quem és”). Empregadores usam “talentogramas” não apenas para
recrutar os mais qualificados, mas principalmente os semelhantes
aos empregados que a empresa já tem e em quem confia.
O Twitter é um caso especialmente interessante porque ele
dadifica humores e sentimentos (a respeito de algo). Qualquer
pessoa pode obter um conjunto de tuítes gratuitamente por meio
de uma interface de aplicação aberta. Além das palavras nos tuítes,
são disponibilizados trinta e três tipos de metadados (quem tuitou,
em que horário, de onde, com qual dispositivo e assim por diante).
Utilizando uma técnica de mineração de textos chamada análise de
sentimento social5, empresas podem “saber” o que certos segmen-
tos sociais pensam de certas marcas, instituições, fatos ou figuras
públicas. Pelo mesmo caminho, financistas monitoram o estado de
humor social médio em determinado contexto, porque tal humor
correlaciona-se com o “humor do mercado” (se positivo, indica
valorização de ativos; se negativo, desvalorização), e pequenas
mudanças de humor causam flutuações que valem muitos milhões
em perdas ou lucros (Bollen, Mao, & Zeng, 2011).
Os dados envolvidos nesses processos combinam três atribu-
tos, até então tecnologicamente mutuamente excludentes: ampla
variedade, grade volume e alta velocidade. Para designar as novas
técnicas de coleta e análise de dados baseadas nesse tripé, surgiu
termos de in u ncia, poder, coes o etc. Ver exemplos de sociograma na forma de grafos em
Lima-Lopes, neste volume.
5 Trata-se um aplicar a um conjunto de tuítes certos algoritmos de análise lexical que podem ser
calibradas por meio de dicionários ou corpora selecionados, ou então, realizadas pela abordagem
da aprendizagem de máquina, já explicada aqui.
100
Gênero reloadinG
o termo Big Data. Os especialistas na área são chamados de cien-

tistas de dados (data scientists), embora não sejam propriamente
cientistas, mas engenheiros, matemáticos ou estatísticos com
múltiplas competências. Para explorar esses conjuntos de dados,
usam-se diferentes formas de inteligência artificial, sobretudo
aprendizagem de máquina (machine learning) 6.
Esse tipo de técnica tem revelado facetas absolutamente
inusitadas do comportamento humano, a partir de correlações
inusitadas nos dados. E porque, em estatística, o tamanho da
amostra afeta diretamente o grau de confiabilidade dos achados,
essas correlações são muito rapidamente alçadas à condição de
fatos, como a sugerir que a correlação superou a causalidade no
jogo da ciência (Anderson, 2006). Boyd & Crowford (2012) veem
nisso uma dimensão mitológica do Big Data, já que fatos quantita-
tivos são, como todo fato científico, resultado de uma construção
(Latour, 2000). Todavia, essa dimensão mitológica está no cerne da
constituição das VDs e NDs enquanto gêneros discursivos. Por isso,
vale a pena rever os pressupostos ontológicos, epistemológicos e
axiológicos que orientam sua comunidade discursiva de origem.
2. IDEOLOGIA DA DADIFICAÇÃO E A NOVA ECONOMIA POLÍTI-

CA DO SIGNO
Para Bakhtin (2010), todo gênero se constitui sobre campos

ideológicos, inclusive os ainda não organizados num sistema bem
definido como o da ciência, que ele chama de “ideologias do quoti-
diano”. Pois bem, o fundamento ideológico primeiro da dadificação
é a visão quantitativa do mundo, que acarreta ver a realidade como
objetiva (positivismo), separável da consciência e da linguagem
(realismo) e mensurável e testável (empirismo). De forma coeren-
te com esses pressupostos, as comunidades tecnocientíficas, tais
6 Aprendizagem de máquina é uma técnica que emula a estruturação cerebral utilizando compo-
nentes eletrônicos como neurônios. Ela permite que os computadores “deduzam” as regras que
conduzem à realização de uma tarefa a partir da exposição a dados, em lugar de programação
explícita. Para uma introdução bastante didática, ver Yee & Chu (2016).
101
Gênero reloadinG
como a do Big Data, privilegiam representações formais que visam

a busca por sentidos universais, e reduzem a linguagem às suas
dimensões sintática e semântica, em detrimento das dimensões
pragmática e discursiva (Quadro 1).
Quadro 1 – Pressupostos das pesquisas quantitativa e qualitativa

Visões quantitativa e qualitativa do mundo
Pressupostos Asserções Visão Visão Qualitativa

fundamentais Quantitativa
Ontológicos A realidade é... objetiva, singular e subjetiva, múltipla e

independente do ob- dependente do ob-
servador. servador.
Epistemológicos A relação entre su- independente. interativa.

jeito (pesquisador)
e objeto é...
Axiológicos O papel dos valo- nulo já que, as des- ativo, já que as des-
res nas descrições crições quantitativas crições são saturadas
dos fenômenos é... são neutras. de valores e nunca
neutras.
Retóricos A linguagem deve formal, amarrada a relativamente infor-

ser... definições contro - mal, processual, e
ladas, impessoal, deixar transparecer a
simples, precisa e voz do pesquisador.
objetiva.
Metodológicos O processo de pes- voltado para genera- voltado para a com-

quisa é... lizações e previsões. preensão.
Fonte: Autoria própria, adaptado de Sukamolson (2007)
Circula hoje nos jornais e nas mídias sociais uma profusão de

fatos curiosos apoiados em Big Data. Por exemplo, uma empresa
de varejo norte-americana descobriu que, durante a lua nova, ven-
de produtos em média 43% mais caros do que na lua cheia (Gage,
2014); um fabricante de dispositivos biométricos constatou que,
no Japão, as pessoas dormem em média 6 horas por noite, enquan-
to em Dubai, elas acordam por volta de 11h00 da manhã (Walch
102
Gênero reloadinG
et al, 2016); uma rede hoteleira nos EUA aumentou em 10% seu
faturamento, cruzando dados meteorológicos com históricos de
cancelamentos de voos e de localização de smartphones de viajantes
(Simpson, 2016). Já o gigante do comércio eletrônico chinês, Ali-
baba, descobriu que, quanto maior o tamanho do sutiã comprado
pela(o) cliente, mais ela(e) gasta no site (Stampler, 2014).
Enquanto alguns desses exemplos remetem a relações de
causa e efeito (Simpson, 2014; Walch et al, 2016), em outros casos,
as correlações são difíceis de explicar causalmente (Gage, 2014 e
Stampler, 2016). Embora, na maior parte das vezes, o cientista
de dados ignore o contexto de geração dos dados, assim como o
conhecimento especializado/teórico pertinente ao assunto (Kitchin,
2014), os “fatos” do Big Data embasam decisões radicalmente
pragmáticas: “vamos fazer hora extra na lua nova” ou “teremos
promoções para sutiãs GG”, pouco importa o porquê.
Anderson (2008, para. 7, minha tradução) causou enorme
polêmica ao declarar:
Fora com todas as teorias de comportamento huma-

no, da linguística à sociologia. Esqueçam taxonomia,
ontologia e psicologia. Quem sabe por que as pessoas
fazem o que elas fazem? O ponto é que elas o fazem, e
nós podemos rastrear e medir isso com uma fidelidade
sem precedentes. Com dados suficientes, os números
falam por si mesmos.
Parece, por conseguinte que o Big Data vem inaugurar uma

nova política do signo, na qual a relação significante/significado, em
lugar de invertida, como propôs Baudrillard (1981), é tautológica:
o signo é o objeto e o objeto é o signo. Latour (2000) já explicava
que, para cientistas e engenheiros, “inscrições cientificas“, como
as métricas do Big Data, funcionam como fiéis porta-vozes da na-
tureza. Latour (1998) adverte, porém, que inscrições não são fatos;
fatos são urdidos como redes heterogêneas que capturam, emba-
ralham e compatibilizam inscrições na forma de textos (e gêneros)
103
Gênero reloadinG
científicos. De que maneira, então, as VDs e NDs, enquanto gêneros

científicos, sustentam essa nova economia política do signo?
3. VISUALIZAÇÃO DE DADOS: PRÁTICAS, ARTEFATOS

E CONCEPÇÕES
Os trabalhos do estatístico britânico William Playfair (2005),

que, em 1786, publicou, entre outros, o gráfico da Figura 2, são
considerados as primeiras VDs da história7.
Figura 2 – “Exports and Imports to and from Africa from 1700 to 1780”
Fonte: Playfair (2005), domínio público
Já mais recentemente, valor metodológico de representações

visuais de dados quantitativos foi enfatizado pelo estatístico John F.
Anscombe (1973), criador do notório Quarteto de Anscombe (Figura
3), em que quatro conjuntos de dados que compartilham as mesmas
métricas descritivas (média, variância etc.) revelam comportamento
totalmente diferente quando examinados visualmente8.
7 O gr co utili a o eixo hori ontal para marcar a dimens o temporal, e o eixo vertical marcar a
dimens o nanceira das trocas entre os dois pa ses. A inclinaç o de cada linha a cada intervalo
de tempo permite ver a evoluç o das trocas, sendo que a rea entre as linhas representa o d cit
acumulado pelo país cuja linha encontra-se na posição superior.
8 O gr co do canto superior esquerdo sugere uma relaç o linear simples (quanto maior o tamanho
do sutiã, mais se gasta). Já o do canto superior direito, também sugere uma correlação forte,
por m n o linear (a relaç o entre o tamanho e o gasto s funciona em alguns casos . No gr co
inferior esquerdo, aparece um ponto de dados aberrante (outlier) que “disfarça” a correlação,
como se fosse mais fraca do que . inalmente, no gr co do canto inferior direito o outlier a
sugere matematicamente haver uma correlação que, na verdade, não existe.
104
Gênero reloadinG
Figura 3 - Quarteto de Anscombe
Fonte: By Anscombe.svg: Schutz derivative work: Avenue (Anscombe.svg), CC BY-SA

3.0, via Wikimedia Commons
Se os estatísticos valorizaram as VDs como instrumento me-

todológico, coube a designers de informação9 como Tufte (1983,
2013), entre outros, pensar a sua eficácia, visando preservar o ideal
da transparência do signo. O autor formulou um conjunto de prin-
cípios e métricas que ainda hoje são considerados fundamentais
na área, entre os quais estão a “razão dados/tinta” (data/ink ratio,
Figura 4) e o “fator mentira” (the lie fator, Figura 5).
9 Design de informação é o campo guarda-chuva que abriga o da visualização de dados, mas

também outras modalidades de representação visual voltadas para informar, por exemplo,
ilustraç o, cartogra a, arquitetura, design gr co, interfaces de computador, entre outros.
105
Gênero reloadinG
Figura 4 – Razão dados/tinta
Boas visualizações induzem o leitor a pensar nos dados, não no seu design.
Fonte: Autoria própria
A razão dados/tinta diz respeito ao conteúdo informativo da

visualização, e é calculada pelo quociente entre a quantidade de
tinta (ou pixels) na peça que efetivamente representa dados e a
quantidade total de tinta (pixels) utilizada. Já o fator mentira diz
respeito às distorções quantitativas causadas por certos efeitos
visuais. Calcula-se dividindo-se a dimensão do efeito no gráfico
pela dimensão do efeito nos dados.
Figura 5 – Fator mentira
A distorção causada pela perspectiva linear faz o valor de agosto parecer maior que os de
janeiro e maio (esq.), e os valores “5“ e “3“, nos setores inferiores, parecerem maiores do que
“6“e “4“, nos superiores (dir.).
Fonte: Autoria própria
106
Gênero reloadinG
A ideia básica da VD é, portanto, é fazer as melhores escolhas

de elementos visuais de modo que a percepção seja exata (Figura
6) e facilite as tarefas cognitivas típicas desse letramento (Figura 7).
Figura 6 – Escala de perceptibilidade gráfica
Fonte: Figura adaptada de Cleveland & McGill (1984, p.532). Minha tradução.
Figura 7 – Um dos tipos de tarefas perceptivo-cognitivas envolvidas

na visualização de dados
Fonte: Autoria própria. Adaptado e traduzido de Szafir et al (2016)
107
Gênero reloadinG
Stephen Pinker (1990) foi um dos primeiros autores ligados

à psicologia/psicolinguística a debruçar-se as VDs, àquela altura
designadas genericamente como “gráficos”.
Para Pinker (1990, p. 76), interpretar uma visualização cor-
responde a formular uma pergunta conceitual (conceptual question)
correspondente à informação buscada e extrair (extract) do gráfico
uma mensagem conceitual (conceptual message). A visualização, con-
tudo, não começa com a pergunta conceitual, havendo três etapas
precedentes a ela sobre as quais há consenso entre Pinker (1990) e
os demais autores reunidos por Ratwani & Gregory Trafton (2008):
Etapa (1): apreensão da imagem global do gráfico e dos elementos

que importa levar-se em conta;
Etapa (2): montagem de predicados e proposições conceituais

(por exemplo “x é retângulo”, “x é mais alto que y”, “x está entre
y e z” ou “a posição de x é 5 na vertical e 2 na horizontal”);
Etapa (3): ativação do esquema do gráfico (graph schema);
Etapa (4) efetivação da pergunta conceitual; e
Etapa (5): geração da mensagem conceitual (um par ordenado

reunindo valor de cada variável (ou par ou série) independente e
o valor (ou diferença ou tendência) da variável dependente cor-
respondente.
Como se vê, autores como Tufte (1983) têm razão em valorizar

a precisão e a clareza dos elementos visuais nas VDs (Figura 6), já
que a percepção visual exerce um papel fundamental no processo
interpretativo. Contudo, nota-se, pelo modelo, que a percepção é
seletiva, limitada a elementos gráficos que compõem predicados
relevantes em relação à pergunta que, por sua vez, não faria sentido
formular-se se não mediante um referencial interpretativo ancorado
em algum fenômeno do mundo real.
108
Gênero reloadinG
Também a etapa 3, em que atua o que Pinker (1990) e Ratwani

& Gregory Trafton (2008) chamam de esquema do gráfico, favorece
a aplicação um enquadre das VDs na lógica dos gêneros discursivos,
já que os mesmos podem ser pensados como esquemas cognitivos
(Marcuschi, 2008, p.149). Além disso, para Pinker (1990), o esque-
ma do gráfico nos indica, de alguma forma, como interpretar VDs
desconhecidas (Figura 8), assim como acontece com os gêneros
segundo Bazerman (2006)10, entre outros.
Figura 8 – Três tipos de gráficos relacionados aos esquemas dos gráficos de linha e de
barras (mudanças de valor nas variáveis ao longo do tempo)
Fonte: Gráfico de velas por Lyakhovskiy Pavel - my job, CC BY-SA 3.0, https://commons.
gráfico de fluxo por Psychonaut, CC0, https://commons.wikimedia.org/w/index.
php?curid=20392905; gráfico em espiral por. Fign44, domínio público, https://
en.wikipedia.org/w/index.php?curid=32259670. Todos acessados em 18 jan, 2018
Concepções de gênero como as de Bakhtin (2003), Swales

(1990) e Bazerman (2006), entre outros, deixam claro que gêneros
são muito mais do que esquemas, assunto ao qual voltaremos mais
10 inker (1990, p. 9 de ne esquema como uma representaç o mnemônica (... que consiste
de uma descrição que contém ‘encaixes’ ou parâmetros para informação ainda não conhecida”.
Para o autor, a escolarização não explica a capacidade humana de compreender formas exóticas
(como as de visuali aç o de Big Data a partir de gr cos mais simples (como os do vestibular
ou do Excel . Os esquemas de gr cos derivariam, em ltima inst ncia, de um esquema geral
inato aparentado daquele que se revela no uso de dimensões espaciais para expressar variáveis
abstratas verbalmente nas línguas naturais (por exemplo, “o mercado está caindo” ou “tenho
larga experi ncia”). Embora Bazerman (2006) não compartilhe da abordagem cognitivista desses
autores, sua de niç o explicita que os g neros s o, modelos que utilizamos para explorar o não
familiar” (p. 23, nfases minhas), porém a palavra original utilizada por Bazerman (1997, p. 19)
que os tradutores substituíram por “modelo” é signpost, isto é, um marco de orientação espacial.
109
Gênero reloadinG
adiante. Ademais, dentro da própria comunidade discursiva do Big

Data, as concepções de VD que Pinker (1990) e Tufte (1983) ajuda-
ram a formular vêm sendo desafiadas. Isso porque, a dadificação
tem expandido a circulação das VDs para contextos variados, nos
quais se demanda delas mais do que exibir os fatos: é preciso que
contem histórias.
4. DATA STORYTELLING: UM GÊNERO REBELDE
Há dois tipos de situações em que os designers de informação

falam em narrativas de dados (NDs). Elas são, não por acaso, deri-
vadas das duas situações de uso que as VDs sempre contemplaram:
a exploração e a comunicação. No caso das NDs exploratórias, o
designer cria uma interface em que o controle da visualização é
passado para o usuário em algum grau, de tal modo que ele ou ela
vá conduzindo o seu próprio percurso de exploração (Figuras 9 e
11). No caso das NDs expositivas, a visualização é montada em uma
sequência fixa, definida pelo designer, quer seja de forma “estática“
(Figura 8) ou em formato de quadros ou de slideshow.
Figura 9 – “Wind Map”
“Wind Map“, visualização criada por Fernanda Viégas (Google) e Martin Wattenberg. Os
“fios” representam a direção e intensidade do vento conforme dados extraídos de hora
em hora do serviço nacional de meteorologia norte-americano.
Fonte: Disponível em http://hint.fm/wind, acesso em 18 jan. 201811
11 Ao clicar em diferentes seções do mapa, o leitor se aproxima de regiões especi cas e acompanha
o comportamento do vento.
110
Gênero reloadinG
Figura 10 – Charles Minard (1781-1870), Carte figurative des pertes successives en

hommes de l’Armée Française dans la campagne de Russie 1812-1813
Fonte: Domínio público 12
Figura 11 – Technology Gives, Technology Takes. Escolhendo sucessivamente entre

sete profissões, o leitor gera uma “narrativa“ sobre o impacto de novos tecnologias no
mercado de trabalho de 1850 a 2013
Fonte: Quocturng/NPR (2015) 13
12 Considerada por Edward Tufte uma das melhores VDs da história, essa visualização resume a
invasão da Rússia por Napoleão com poucos elementos visuais que agregam várias dimensões
(direção de ida e volta, posição, número de soldados, data e temperaturas ao longo da marcha).
13 O leitor pode escolher uma entre oito ocupações disponíveis no primeiro plano. Clicando sobre
as linhas ao fundo, ele pode ver de que pro ss o a linha trata e qual o valor naquele ponto. As
mudanças bruscas de inclinação nas curvas de emprego coincidem com épocas de diferentes
“revoluções tecnológicas”.
111
Gênero reloadinG
Com alguma boa vontade, poderíamos pensar em Napoleão (Fi-

gura 8), ou nos trabalhadores (Figura 9), como protagonistas de uma
narrativa, e nos russos ou nas tecnologias como antagonistas, e nos
designers como narradores, sendo a trajetória das variáveis a cada novo
ponto de dados, talvez, o enredo. Mas não é desse tipo de metáfora
que falam os especialistas quando se referem a data storytelling. A quê,
exatamente, se referem, porém, não é fácil identificar.
Rocha (2016, p.4, ênfases minhas), uma jornalista, por exemplo,
define data storytelling como narrativas digitais em que “a análise ou
a mensagem não se concentra nos argumentos, opiniões, atos ou
eventos, mas na interpretação contextual de uma informação e suas
relações com outros dados”. Já Gilbert (2017, p.7, minha tradução,
ênfases minhas), consultora de negócios, as concebe como “um mé-
todo de transmitir (deliver) mensagens derivadas da análise de dados
complexos de forma a permitir que o público a assimile (assimilate)
rápida e facilmente determinado material (...)”. Hullman – docente
de um departamento de Ciências da Computação, doutora em visu-
alização da informação, com mestrado em Letras – e seus colegas
mencionam “processos sequenciais de definição do contexto, sele-
ção de informação, escolha de modalidade e definição de uma ordem
que possa transmitir (convey) a narrativa desejada de forma efetiva”,
acrescentando que, “quer seja ficcional ou para comprovação dos
fatos (trial evidence), a sequência e forma de agrupamento utilizados
numa narrativa afetam o significado que é construído” (Hullman et
al, 2013, p. 2406, minha tradução, ênfases minhas).
Percebe-se nesse pequeno conjunto interdisciplinar uma certa
desestabilização do objeto VD assim como um maior ceticismo
acerca sua transparência enquanto signo. Hullman et al (2013)
tocam na tensão aí implicada ao justaporem, de forma um tanto
surpreendente, histórias de ficção e técnicas de demonstração cien-
tifica (ou jurídica) da verdade num mesmo paradigma. O paradigma,
contudo, surge de um casamento entre narrativa e prova científica
em que os bens comuns são segmentação e sequencialidade, dois
traços comuns a praticamente quaisquer gêneros.
112
Gênero reloadinG
Gilbert (2017, p.4, minha tradução, ênfases minhas), por sua

vez, prefere descartar a definição tradicional de narrativa (story),
que inclui elementos como personagem protagonista, conflito e
diálogos, oferecendo, em seu lugar, a seguinte: “relatos (accounts)
de eventos reais ou imaginários que envolvam o ouvinte (listener)
em comunicação interativa”. Importa menos notar que a autora
simplesmente troca narrativa por relato interativo, do que ressaltar
dois elementos de caráter enunciativo-discursivos agregados à sua
definição: envolvimento e interação.
Rocha (2016, p.4), finalmente, parte de uma definição mais
solta de narrativa, próxima de news story no jornalismo norteameri-
cano. Pelo destaque de “interpretação contextual“ e “relações com
outros dados”, com o descarte de “atos ou eventos”, percebe-se,
na verdade, uma barganha entre estrutura narrativa e enquadre
jornalístico, isto é, retórico-discursivo, das NDs.
Contabilizando os elementos tirados das tentativas de defini-
ção de data storytelling acima, fica patente um jogo de apropriação
e contra-apropriação na constituição do objeto ND que mobiliza
elementos formais/sintáticos (segmentação, sequencialidade),
enunciativo-discursivos (envolvimento, interatividade), e textuais
(contexto e relação com outros dados). Pode estar havendo, sim-
plesmente, o que Setzer (1999) chama de “abuso de linguagem”,
i.e., um empréstimo reducionista de “narrativa”, pelas ciências da
computação, do tipo que ocorre em “linguagens de programação”
e “inteligência artificial”. Ainda que assim fosse, isso só indicaria
que as NDs são, no momento, um gênero bastardo, descendente
de uma mancebia entre quantitativo e qualitativo que, para todos
os efeitos, não poderia ter havido, mas há.
5. NARRATIVAS DE DADOS COMO GÊNERO TEXTUAL/DISCURSIVO
A literatura especializada em design de informação menciona

gêneros. Segel & Heer (2010), por exemplo, propõem uma taxo-
nomia que inclui “estilo revista”, “quadro anotado”, “pôster parti-
113
Gênero reloadinG
cionado”, “diagrama de fluxo”, “história em quadrinhos”, “exibição

de slides” e “filme/vídeo/animação” como gêneros. Ocorre que
visualizações narrativas (narrative visualizations) não são propria-
mente data storytelling. Os gêneros de que falam os autores são,
na verdade, formatos de interfaces de dados.
Quando o assunto são NDs propriamente ditas, não se acha
facilmente referências a gêneros, embora muitos autores utilizem
uma ótica discursiva. Kostelnick (2007, p.287), por exemplo, ponde-
ra que a clareza de uma VD ou ND é algo contingente e situado, que
varia com as comunidades discursivas. Já Hepworth (2014, p.281,
minha tradução), afirma que as VDs “atuam para mudar atitudes,
comportamentos e intenções apresentando informações de forma
persuasiva e retórica”.
Finalmente, Hullman e Diakopoulos (2011), que estudaram um
corpus de NDs utilizando categorias de análise oriundas da semio-
logia e da ciência política, concluíram que há quatro camadas que
servem às intenções retórico-discursivas do designer: a dos dados
(manipulação de variáveis, escalas, outliers e formas de agregação),
a da representação visual (pistas visuais que afetam o mapeamento
dos dados), a das anotações (direcionamento da atenção do usuário)
e a da interatividade (possibilidades de manuseio da interface que
encorajam/restringem caminhos de exploração).
Esses enfoques qualificam as NDs claramente como enuncia-
dos (multimodais) situados sócio-historicamente, que estabelecem
o diálogo entre atores sociais (Bakhtin, 2003), funcionam como
eventos retóricos tipificados vinculados a objetivos específicos
(Swales, 1990) e estabelecem molduras para a ação social (Bazer-
man, 2006). Porém, teorias de gênero discursivo usuais parecem
não conseguir acolher o objeto em sua totalidade. Por exemplo,
em qualquer teoria de gênero, o conteúdo temático é um fator
definidor. Já um mesmo tipo de visualização pode dizer respeito
a qualquer entidade ou tema, ou mesmo misturar elementos que
normalmente não caberiam numa mesma formação temática ou
114
Gênero reloadinG
ideológica. Além disso, as teorias de gênero lhes atribuem padrões

composicionais/sequenciais típicos, enquanto, nas VDs/NDs, o que
se faz é perscrutar o conteúdo em busca de padrões composicionais
(de correlação), por exemplo invertendo as variáveis nos eixos ou
o tipo de gráfico para os mesmos dados (Figuras 6 e 7).
Nós tendemos a pensar nos gêneros como uma entidade que
emerge do contexto, quer seja da interação entre sujeitos social-
mente organizados (Bakhtin, 2003), das expectativas em relação
ao que é mais ou menos provável ser dito ou escrito para certo
propósito em certa situação (Swales, 1990), ou da recorrência de
determinada situação em determinada cultura (Bazerman, 2006).
Embora certos tipos de VDs sejam correlacionadas com certos
propósitos e situações (uma consulta médica ou uma análise de
crédito, por exemplo), o que determina o tipo provável de VD não
é tanto sua natureza social, mas a natureza do fenômeno em exa-
me estatístico (coletivo, particular, de multidão, típico ou atípico).
Quando pensamos mais especificamente em data storytelling,
porém, o fator mais evidente de dificuldade parece ser o de com-
patibilizar a ideia de mostrar/visualizar com a de narrar/fechar
num mesmo gênero. Certamente não disponho de uma solução
para o problema, mas penso que posso sugerir uma estratégia de
investigação sobre NDs como gêneros: o trabalho de Manovich
(1999, 2000) acerca das relações entre narrativa e banco de dados.
6. NARRATIVAS DE DADOS COMO GÊNERO DA TRANSCODIFI-

CAÇÃO CULTURAL
Manovich (2001) foi um dos primeiros teóricos a abordar as

repercussões culturais e semióticas da digitalização. Para o autor,
todo artefato cultural computacional/digital se instaura na interface
entre duas camadas semióticas/ontológicas justapostas pelas novas
mídias: a dos significados humanos (figuras, esquemas mentais,
gêneros discursivos, semântica da língua etc.) e a das linguagens
de computador (pacotes, variáveis, funções, algoritmos, estrutu-
115
Gênero reloadinG
ras de dados, linguagens de programação etc.). Desse convívio,

segundo Manovich (2000), resulta que a lógica do computador
(sua ontologia, semântica, pragmática e mesmo seus gêneros14)
influencia fortemente lógica dos sistemas culturais15, algo que ele
chamou de transcodificação cultural.
Podemos considerar exemplos de transcodificação cultural,
a explosão do remix digital (copy-paste), crimes como o “roubo
de identidade” virtual (não existem pessoas na ontologia com-
putacional, apenas userIDs), ou o uso de metáforas visuais de
interfaces de computador em outras mídias (por exemplo, o
sinal de like do Facebook na TV ou anúncios de revista). Porém,
num nível mais profundo do processo de transcodificação, se-
gundo Manovich (1999, 2000), observa-se a perda de espaço
da narrativa para o banco de dados enquanto forma simbólica16
contemporânea.
Narrativa e banco de dados sempre conviveram, inclusive fun-
damentando seus próprios gêneros, por exemplo, livro (narrativa) e
álbum de fotografias (banco de dados), conto (narrativa) e antologia
(banco de dados), filme (narrativa) e fotografia (banco de dados) e
assim por diante. Mas a digitalização (e, agora, a dadificação) ex-
pandiram nossa capacidade de criar, alimentar, acessar, vasculhar e
conectar bancos de dados de forma exponencial, permitindo-nos,
inclusive, criar bancos de dados que contêm, basicamente, narra-
tivas (Google Books, Netflix, MMORPGs, Pornhub etc.)
Além disso, nossas práticas de leitura e escrita, hoje, incluem
o atravessamento constante de bancos de dados e o estabeleci-
mento de padrões associativo-sequenciais, que podem ser mais ou
menos coesas/coerentes, mas não são necessariamente sequências
narrativas. É o caso de ler resultados trazidos numa página do
14 O hipertexto, por exemplo, é tributário de uma forma de escrever códigos de software chamada
programação modular ou programação estruturada.
15 Ver também Lima-Lopes, neste volume.
16 Manovich (1999) tira o conceito da obra de Panofsky (1999), para quem a forma simbólica de
cada época é aquilo que permite explicar de que modo o mundo se torna inteligível para aquela
geração e é ela que orienta as grandes construções intelectuais e sociais pelas quais o homem
se relaciona com o Mundo.
116
Gênero reloadinG
Google, ouvir uma playlist no Spotify, “zapear” vídeos no YouTube

ou compor/acompanhar uma linha do tempo no Facebook17.
Para Manovich (1999), podemos entender bem essas mudanças
a partir do esquema Saussuriano (1995) dos eixos sintagmático
e paradigmático. As narrativas, argumenta, têm no eixo sintag-
mático seu lugar natural. Assim como a sintaxe, elas impõem
determinada sequência para a produção do sentido, conectam os
eventos primordialmente a partir de uma lógica causal, operam
uma hierarquização de seus elementos e têm seu sentido altera-
do pela inserção de novos constituintes. Já os bancos de dados
se encaixam melhor no eixo paradigmático porque, apesar de
apresentarem estrutura, não impõem uma sequência, conectam
seus componentes por meio de uma lógica associativa/correlacio-
nal, não hierarquizam seus elementos entre si e acolhem novos
constituintes indefinidamente, sem prejuízo dos sentidos. Além
disso, enquanto a narrativa explicita os elementos sintagmáticos
e virtualiza os paradigmáticos, o banco de dados faz justamente o
contrário. Esta é a razão das duas poderem coexistir, mas também
de competirem enquanto duas formas poderosas de apreensão do
mundo: mostrar/visualizar e narrar/escutar (ou ler).
As NDs são difíceis de encaixar nas teorias de gêneros, é plau-
sível pensar, porque tais teorias, em sua maioria, foram pensadas
para gêneros “sintagmáticos”, constituídos por sequências textu-
ais (descritiva, argumentativa, narrativa, injuntiva etc.) e tipos de
discurso eminentemente sequenciais, como o discurso teórico, o
relato interativo e a narração (Halliday, 1985; Bronckart, 1999). Nos
gêneros narrativos, o percurso de significação é predefinido, e é
ele que estabelece a relação entre os elementos paradigmáticos,
atualizando-os a cada enunciacao, para gerar o sentido. Já nos gêne-
ros de bancos de dados, podemos elaborar com base em Manovich
(1999, 2000), os paradigmas estão disponíveis de forma explícita
(nas mesmas colunas das tabelas de dados, concretamente), antes
que os percursos de associação venham a propiciar a geração de
17 Lemke (2009), chama esses padrões de “travessias” (traversals).
117
Gênero reloadinG
sentidos. A significação começa em qualquer ponto do espaço

relacional, e o percurso é a exploração do espaço relacional, que
pode ou não redundar num fechamento dos sentidos.
Por constituírem justamente uma das comunidades desde sem-
pre na vanguarda da transcodificação cultural, quando os designers
de VDs falam em contar histórias com dados, aparentemente estão
buscando referência a uma forma genérica híbrida de narrativa e
banco de dados. Contudo, gêneros de banco de dados tais quais
o museu virtual, o filme minimalista ou o game não narrativo,
além das VDs tradicionais, buscam propositalmente abrir mão de
relações causais e resoluções, sendo essa característica, neles, uma
virtude. Já a ideia de storytelling implica uma busca por causalidade
e resolução/fechamento, através de um objeto que é, por natureza,
paradigmático, associativo e relacional.
Se Lemke (2002) estiver certo quando explica que os gêneros
não são nunca “monomodais”, mas parte do processo pelo qual os
modos semióticos coevoluem, talvez a saída para essa comunidade
discursiva esteja num reencontro menos acanhado e isento de pre-
conceitos entre os usos do não verbal e do verbal; mas, dadas as
relações de poder em jogo na dadificação e a dinâmica avassaladora
da transcodificação cultural, talvez resulte desse encontro, amanhã,
um verbal de tal forma domesticado, objetificado e subalternizado
que os estudos da linguagem não mais o reconheçam como seu;
a menos que estejam atentos para o fenômeno da dadificação
desde ontem.
7. CONSIDERAÇÕES FINAIS
Neste capítulo, procurei chamar a atenção da comunidade

dos estudos da linguagem para a necessidade de um engajamento
sistemático com o fenômeno da dadificação, tal qual instanciado
nas práticas semióticas quotidianas e, por conseguinte, em certos
gêneros discursivos que vêm ganhando notoriedade nos mais di-
versos domínios socioculturais.
118
Gênero reloadinG
Vimos que a dadificação traz uma dimensão técnica, que inclui

uma nova área de pesquisa e aplicação chamada Big Data, e uma
dimensão ideológica subjacente, que projeta a visão quantitativa
do mundo sobre facetas inusitadas do comportamento humano.
Essa visão fundamenta uma espécie de nova economia política
do signo, instanciada por um gênero cada vez mais valorizado e
poderoso: as VDs.
Com a expansão da dadificação, as VDs alcançam diferentes
comunidades discursivas, que lhes atribuem a nova função de nar-
rar os fenômenos que, anteriormente, esperava-se que ele apenas
mostrasse. Como consequência, abre-se uma oportunidade maior
para enquadrar NDs numa concepção enunciativo-discursiva, por
meio do conceito de gênero. O impulso de tratar NDs como gê-
neros, ficou claro, é amortecido pela constatação de que o objeto
parcialmente é refratário às concepções de gênero tradicionais e
vice-versa.
As NDs parecem tornar-se mais acessíveis aos estudos da
linguagem, não quando tentamos projetar sobre elas diferentes
teorias de gênero, mas quando projetamos sobre as concepções
tradicionais de gênero esse pequeno e poderoso híbrido que de-
manda delas uma “recarga”, como sugere o título deste volume.
Daí a proposta de buscar na teoria de Manovich (1999, 2000) um
ponto de partida para o aprofundamento das pesquisas sobre NDs,
conceituando-as como gêneros híbridos de narrativa e banco de
dados. Como todo hibrido, este causa uma tensão, neste caso
entre duas formas de apreensão do mundo, que refletem divisas
de poder epistemológico e político.
Para que essa ou qualquer outra abordagem acadêmica da
dadificação seja bem-sucedida, contudo, há que se estabelecer um
tipo de relação mais fluida, criativa e respeitosa entre as ciências
humanas e as ciências naturais/exatas (Buzato, 2016). Isso, é claro,
passa pela valorização de métodos e práticas interdisciplinares
nas formações de pesquisadores e professores em ambos os lados
119
Gênero reloadinG
(Buzato, 2017a), algo que no contexto brasileiro permanece um

sonho distante. Só assim poderemos contribuir para uma apro-
priação benigna da cultura dos dados (abertos) pelo cidadão e o
estabelecimento de melhores diretrizes educacionais, políticas e
éticas no uso de dados (Metcalf & Crowford, 2016) sobre seres
humanos, rumo ao próximo passo, qual seja, a constituição de
uma ética pós-humanista (Buzato, 2017b)18.
REFERÊNCIAS
Anscombe, F. J. (1973). Graphs in Statistical Analysis. The American

Statistician, 27(1), 17.
Anderson, C. (2008, junho 23). The End of Theory: The Data Deluge Makes
the Scientific Method Obsolete. WIRED. Recuperado de http://www.
wired.com/2008/06/pb-theory/
Bakhtin, M. M. (2003). Estética da criação verbal. (P. Bezerra, Trad.). São
Paulo: Martins Fontes.
Bakhtin, M. M. (2010). Marxismo e filosofia da linguagem: problemas
fundamentais do metodo sociologico na ciência da linguagem. São Paulo
(SP): Hucitec.
Baudrillard, J. (1981). For a critique of the political economy of the sign. St.
Louis, MO: Telos Press.
Bazerman, C. (1997). The life of genre, the life in the classroom. In
W. Bishop & H. Ostrom (Eds.), Genre and writing: Issues, arguments,
alternatives (p. 19-26). Portsmouth, NH: Boynton/Cook.
Bazerman, C. (2006). Gênero, agência e escrita. (J. C. Hoffnagel, A. P.
Dionisio, & A. R. Vieira, Orgs.). São Paulo: Cortez.
Bollen, J., Mao, H., & Zeng, X. (2011). Twitter mood predicts the stock
market. Journal of Computational Science, 2(1), 1–8.
boyd, danah, & Crawford, K. (2012). Critical questions for Big Data:
provocations for a cultural, technological, and scholarly phenomenon.
Information, Communication & Society, 15(5), 662–679. https://doi.org/
10.1080/1369118X.2012.678878
Brandão, R. F. (2018). Statistics in science journalism: an exploratory
study of four leading British and Brazilian newspapers. In A. Nguyen
(Org.), News, numbers and public opinion in a data-driven world: edited by
an nguyen. New York: Bloomsbury Academic.
Bronckart, J. P. (1999). Atividade de linguagem, textos e discursos: Por
um interacionismo sócio-discursivo. São Paulo: EDUC
18 Ver também Ribas, neste volume.
120
Gênero reloadinG
Buzato, M. E. K. (2016). Towards an interdisciplinary ICT applied ethics:

language matters. Revista Brasileira de Linguística Aplicada, 16(3),
493–519.
Buzato, M. E. K. (2017). Critical Data Literacies: going beyond words to
challenge the illusion of a literal world. In N. H. Takaki & W. Monte
Mor (Orgs.), Construções de sentido e letramento digital crítico na área de
línguas e linguagem (p. 119–142). Campinas, SP: Pontes Editores. (a)
Buzato, M. E. K. (2017). Towards a theoretical mashup for studying
posthuman/postsocial ethics. Journal of Information, Communication
and Ethics in Society, 15(1), 74–89. (b)
Cleveland, W. S., & McGill, R. (1984). Graphical Perception: Theory,
Experimentation, and Application to the Development of Graphical
Methods. Journal of the American Statistical Association, 79(387), 531–
554. https://doi.org/10.1080/01621459.1984.10478080
Cope, B., & Kalantzis, M. (2016). Big Data Comes to School: Implications
for Learning, Assessment, and Research. AERA Open, 2(2). https://doi.
org/10.1177/2332858416641907
ESTADÃO INFOGRÁFICOS. Mapa da violência no Brasil. Estadão online,
2010. Disponível em: <http://www.estadao.com.br/infograficos/
cidades,mapa-da-violencia-no-brasil,280781>. Acesso em: 27 mar.
2018..
Gage, D. (2014, março 23). Big Data Uncovers Some Weird Correlations.
Wall Street Journal. Recuperado de https://www.wsj.com/articles/big-
data-helps-companies-find-some-surprising-correlations-1395168255
Gilbert, M. (2014). Data stories - how to combine the power storytelling with
effective data visualization. Recuperado de https://pt.slideshare.net/
miriamgilbert08/data-stories-workshop-34390209?from_action=save
Halliday, M. A. K. (1985). Part A. In: M. A. K. Halliday & R. Hasan. Language,
context, and text: Aspects of language in a social-semiotic perspective.
Oxford: Oxford University Press: 1-49
Harari, G. M., Lane, N. D., Wang, R., Crosier, B. S., Campbell, A. T., &
Gosling, S. D. (2016). Using Smartphones to Collect Behavioral Data
in Psychological Science: Opportunities, Practical Considerations,
and Challenges. Perspectives on Psychological Science, 11(6), 838–854.
Hepworth, K. (2016). History, power and visual communication artefacts.
Rethinking History, 20(2), 280–302.
Hullman, J., & Diakopoulos, N. (2011). Visualization Rhetoric: Framing
Effects in Narrative Visualization. IEEE Transactions on Visualization and
Computer Graphics, 17(12), 2231–2240.
Hullman, J., Drucker, S., Riche, N. H., Bongshin Lee, Fisher, D., &
Adar, E. (2013). A Deeper Understanding of Sequence in Narrative
Visualization. IEEE Transactions on Visualization and Computer Graphics,
19(12), 2406–2415.
121
Gênero reloadinG
Kennedy, H., Poell, T., & van Dijck, J. (2015). Data and agency. Big Data &
Society, 2(2). https://doi.org/10.1177/2053951715621569
Kitchin, R. (2014). Big Data, new epistemologies and paradigm shifts.
Big Data & Society, 1(1). https://doi.org/10.1177/2053951714528481
Kostelnick, C. (2007). The Visual Rhetoric of Data Displays: The
Conundrum of Clarity. IEEE Transactions on Professional Communication,
50(4), 280–294.
Latour, B. (1998). Writing Science - fact or fiction. In M. Callon, J. Law, &
A. Rip (Orgs.), Mapping the dynamics of science and technology: sociology
of science in the real world (Nachdr., p. 51–66). Houndmills: Macmillan.
Latour, B. (2000). Ciência em ação : como seguir cientistas e engenheiros
sociedade afora. (I. C. Benedetti, Trad.). São Paulo: Editora UNESP.
Lemke, J. L. (2002). Travels in hypermodality. Visual Communication, 1(3),
299–325.
Lemke, J. (2009). Multimodal genres and transmedia traversals: Social
semiotics and the political economy of the sign. Semiotica, 1/4(173),
283–297.
Manovich, L. (1999). Database as Symbolic Form. Convergence: The
International Journal of Research into New Media Technologies, 5(2), 80–99.
Manovich, L. (2000). Database as a genre of new media. AI & Society,
14(2), 176–183.
Manovich, L. (2001). The language of new media. Cambridge, Mass.: MIT Press.
Marcuschi, L. A. (2008). Produção textual, análise de gêneros e compreensão. São
Paulo: Parábola Editorial.
Mayer-Schönberger, V., & Cukier, K. (2013). Big data a revolution that
will transform how we live, work, and think. Boston: Houghton
Mifflin Harcourt. Recuperado de http://public.eblib.com/choice/
publicfullrecord.aspx?p=3304666
Metcalf, J., & Crawford, K. (2016). Where are human subjects in Big Data
research? The emerging ethics divide. Big Data & Society, 3(1). https://
doi.org/10.1177/2053951716650211
Oliveira, D. R. (2013, setembro 7). Fluxo das Emendas Parlamentares.
Recuperado 25 de janeiro de 2018, de http://blog.estadaodados.com/
fluxo-emendas-parlamentares/ Negroponte, N. (1995). Being digital
(1st ed). New York: Knopf.
Palmer, M. (2006, novembro 3). Data is the New Oil. Recuperado 26 de
janeiro de 2018, de http://ana.blogs.com/maestros/2006/11/data_is_
the_new.html
Panofsky, E. (1999). A Perspectiva como Forma Simbólica. (E. Nunes, Trad.).
Lisboa: Edicoes 70.
Pinker, S. (1990). A theory of graph comprehension. In R. O. Freedle (Org.),
Artificial intelligence and the future of testing (p. 73–126). Hillsdale, NJ:
Erlbaum [u.a.].
122
Gênero reloadinG
Playfair, W. (2005). Commercial and political atlas and Statistical breviary.

Cambridge ; New York: Cambridge University Press.
Quoctrung Bui/NPR. (2015, maio 18). How Machines Destroy (And Create!)
Jobs, In 4 Graphs. Recuperado 27 de janeiro de 2018, de https://
www.npr.org/sections/money/2015/05/18/404991483/how-machines-
destroy-and-create-jobs-in-4-graphs
Ratwani, R. M., & Gregory Trafton, J. (2008). Shedding light on the graph
schema: Perceptual features versus invariant structure. Psychonomic
Bulletin & Review, 15(4), 757–762.
Rocha, L. V . (2016) Modelos de narrativas presentes no ciberjornalismo
esportivo nacional e internacional. In: 7º Congresso Internacional
de Ciberjornalismo, 2016, Campo Grande. Anais do 7º Congresso
Internacional de Ciberjornalismo, 2016. v. 1. p. 1-100
Saussure, F. (1995). Curso de lingüística geral. São Paulo: Cultrix
Segel, E., & Heer, J. (2010). Narrative Visualization: Telling Stories with
Data. IEEE Transactions on Visualization and Computer Graphics, 16(6),
1139–1148.
Setzer, V. W. (1999). Dado, Informação, Conhecimento e Competência.
DataGramaZero - Revista de Ciência da Informação, (0)0, Artigo 1.
Simpson, K. (2016, novembro 3). Hospitality and Big Data: A Love Story.
Recuperado 13 de janeiro de 2018, de https://blog.safetyculture.com/
industry-trends/three-hotel-chains-using-big-data-exceed-revenue-
projections
Stampler, L. (2014, novembro 13). Alibaba Links Women’s Bra Sizes to
Their Online Spending Patterns. Time (Online). Recuperado de http://
time.com/3583945/alibaba-singles-day-bra-sizes/
Sukamolson, S. (2007). Fundamentals of quantitative research: Bangkok,
Thailand: EJTR Retrieved from http://www.culi.chula.ac.th/e-Journal/
bod/Suphat%20Sukamolson.pdf
Swales, J. M. (1990). Genre analysis: English in academic and research settings
(13. printing). Cambridge: Cambridge Univ. Press.
Tufte, E. R. (1983). The visual display of quantitative information. Cheshire,
CT: Graphic Press.
Tufte, E. R. (2013). Envisioning information (Fourteenth printing). Cheshire,
Connecticut: Graphics Press.
Walch, O. J., Cochran, A., & Forger, D. B. (2016). A global quantification
of “normal” sleep schedules using smartphone data. Science Advances,
2(5), e1501705–e1501705. https://doi.org/10.1126/sciadv.1501705
Yee, S., & Chu, T. (2016). Uma Introdução Visual ao Aprendizado de
Máquina. Recuperado 26 de janeiro de 2018, de http://www.r2d3.us/
uma-introducao-visual-ao-aprendizado-de-maquina-1/
123

BUZATO - Data Storytelling Genero Bastardo

Enviado por

Dados do documento

Descrição original:

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

BUZATO - Data Storytelling Genero Bastardo

Enviado por

Direitos autorais:

Formatos disponíveis

Gênero reloadinG

DATA STORYTELLING E A DADIFICAÇÃO DE TUDO:

Marcelo El Khouri Buzato

A dadificação é o processo pelo qual volumes extraordinários

Há muito, os estudos da linguagem no campo aplicado têm

“picos” numéricos visualmente com as regiões correspondentes

Figura 1 - Mapa da violência no Brasil por volta de 2010

Brandão (2018) entende que é papel desse tipo de jornalismo

capacitar o cidadão a “compreender, questionar e, quando neces-

1. DADIFICAÇÃO: O QUE É E COMO FUNCIONA

Filosoficamente, um dado é justamente algo “dado”, ou seja,

Podemos, agora, (re)definir dadificação como uma atividade

profissional, para gerar “talentogramas” (talent graphs); o Twitter

o termo Big Data. Os especialistas na área são chamados de cien-

2. IDEOLOGIA DA DADIFICAÇÃO E A NOVA ECONOMIA POLÍTI-

Para Bakhtin (2010), todo gênero se constitui sobre campos

como a do Big Data, privilegiam representações formais que visam

Quadro 1 – Pressupostos das pesquisas quantitativa e qualitativa

Pressupostos Asserções Visão Visão Qualitativa

Ontológicos A realidade é... objetiva, singular e subjetiva, múltipla e

Epistemológicos A relação entre su- independente. interativa.

Retóricos A linguagem deve formal, amarrada a relativamente infor-

Metodológicos O processo de pes- voltado para genera- voltado para a com-

Fonte: Autoria própria, adaptado de Sukamolson (2007)

Circula hoje nos jornais e nas mídias sociais uma profusão de

Fora com todas as teorias de comportamento huma-

Parece, por conseguinte que o Big Data vem inaugurar uma

científicos. De que maneira, então, as VDs e NDs, enquanto gêneros

3. VISUALIZAÇÃO DE DADOS: PRÁTICAS, ARTEFATOS

Os trabalhos do estatístico britânico William Playfair (2005),

Fonte: Playfair (2005), domínio público

Já mais recentemente, valor metodológico de representações

Figura 3 - Quarteto de Anscombe

Fonte: By Anscombe.svg: Schutz derivative work: Avenue (Anscombe.svg), CC BY-SA

Se os estatísticos valorizaram as VDs como instrumento me-

9 Design de informação é o campo guarda-chuva que abriga o da visualização de dados, mas

Figura 4 – Razão dados/tinta

A razão dados/tinta diz respeito ao conteúdo informativo da

Figura 5 – Fator mentira

Fonte: Autoria própria

A ideia básica da VD é, portanto, é fazer as melhores escolhas

Figura 6 – Escala de perceptibilidade gráfica

Figura 7 – Um dos tipos de tarefas perceptivo-cognitivas envolvidas

Fonte: Autoria própria. Adaptado e traduzido de Szafir et al (2016)

Stephen Pinker (1990) foi um dos primeiros autores ligados

Etapa (1): apreensão da imagem global do gráfico e dos elementos

Etapa (2): montagem de predicados e proposições conceituais

Etapa (3): ativação do esquema do gráfico (graph schema);

Etapa (4) efetivação da pergunta conceitual; e

Etapa (5): geração da mensagem conceitual (um par ordenado

Como se vê, autores como Tufte (1983) têm razão em valorizar

Também a etapa 3, em que atua o que Pinker (1990) e Ratwani

Concepções de gênero como as de Bakhtin (2003), Swales

adiante. Ademais, dentro da própria comunidade discursiva do Big

4. DATA STORYTELLING: UM GÊNERO REBELDE

Há dois tipos de situações em que os designers de informação

Figura 9 – “Wind Map”

Fonte: Disponível em http://hint.fm/wind, acesso em 18 jan. 201811

Figura 10 – Charles Minard (1781-1870), Carte figurative des pertes successives en

Fonte: Domínio público 12

Figura 11 – Technology Gives, Technology Takes. Escolhendo sucessivamente entre

Fonte: Quocturng/NPR (2015) 13