Escolar Documentos
Profissional Documentos
Cultura Documentos
BUZATO, Marcelo. Data Storytelling e a dadificação de tudo: um gênero bastardo de mãe narrativa e pai banco de dados. In:
LIMA-LOPES, R. E. DE; BUZATO, M. E. K. (Org.). Gênero Reloading. Campinas, SP: Potes Editores, 2018. p. 95–123.
Resumo
95
Gênero reloadinG
0. INTRODUÇÃO
96
Gênero reloadinG
97
Gênero reloadinG
2 Em sua obra “Os Dados”, escrita por volta de 300 AC, Euclides chama de dado um conjunto
de partes ou relações de uma gura plana tal que, faltando uma, mas tendo-se as demais, a
faltante já está determinada.
98
Gênero reloadinG
99
Gênero reloadinG
100
Gênero reloadinG
6 Aprendizagem de máquina é uma técnica que emula a estruturação cerebral utilizando compo-
nentes eletrônicos como neurônios. Ela permite que os computadores “deduzam” as regras que
conduzem à realização de uma tarefa a partir da exposição a dados, em lugar de programação
explícita. Para uma introdução bastante didática, ver Yee & Chu (2016).
101
Gênero reloadinG
Axiológicos O papel dos valo- nulo já que, as des- ativo, já que as des-
res nas descrições crições quantitativas crições são saturadas
dos fenômenos é... são neutras. de valores e nunca
neutras.
102
Gênero reloadinG
et al, 2016); uma rede hoteleira nos EUA aumentou em 10% seu
faturamento, cruzando dados meteorológicos com históricos de
cancelamentos de voos e de localização de smartphones de viajantes
(Simpson, 2016). Já o gigante do comércio eletrônico chinês, Ali-
baba, descobriu que, quanto maior o tamanho do sutiã comprado
pela(o) cliente, mais ela(e) gasta no site (Stampler, 2014).
Enquanto alguns desses exemplos remetem a relações de
causa e efeito (Simpson, 2014; Walch et al, 2016), em outros casos,
as correlações são difíceis de explicar causalmente (Gage, 2014 e
Stampler, 2016). Embora, na maior parte das vezes, o cientista
de dados ignore o contexto de geração dos dados, assim como o
conhecimento especializado/teórico pertinente ao assunto (Kitchin,
2014), os “fatos” do Big Data embasam decisões radicalmente
pragmáticas: “vamos fazer hora extra na lua nova” ou “teremos
promoções para sutiãs GG”, pouco importa o porquê.
Anderson (2008, para. 7, minha tradução) causou enorme
polêmica ao declarar:
103
Gênero reloadinG
Figura 2 – “Exports and Imports to and from Africa from 1700 to 1780”
7 O gr co utili a o eixo hori ontal para marcar a dimens o temporal, e o eixo vertical marcar a
dimens o nanceira das trocas entre os dois pa ses. A inclinaç o de cada linha a cada intervalo
de tempo permite ver a evoluç o das trocas, sendo que a rea entre as linhas representa o d cit
acumulado pelo país cuja linha encontra-se na posição superior.
8 O gr co do canto superior esquerdo sugere uma relaç o linear simples (quanto maior o tamanho
do sutiã, mais se gasta). Já o do canto superior direito, também sugere uma correlação forte,
por m n o linear (a relaç o entre o tamanho e o gasto s funciona em alguns casos . No gr co
inferior esquerdo, aparece um ponto de dados aberrante (outlier) que “disfarça” a correlação,
como se fosse mais fraca do que . inalmente, no gr co do canto inferior direito o outlier a
sugere matematicamente haver uma correlação que, na verdade, não existe.
104
Gênero reloadinG
105
Gênero reloadinG
Boas visualizações induzem o leitor a pensar nos dados, não no seu design.
Fonte: Autoria própria
A distorção causada pela perspectiva linear faz o valor de agosto parecer maior que os de
janeiro e maio (esq.), e os valores “5“ e “3“, nos setores inferiores, parecerem maiores do que
“6“e “4“, nos superiores (dir.).
106
Gênero reloadinG
Fonte: Figura adaptada de Cleveland & McGill (1984, p.532). Minha tradução.
107
Gênero reloadinG
108
Gênero reloadinG
Figura 8 – Três tipos de gráficos relacionados aos esquemas dos gráficos de linha e de
barras (mudanças de valor nas variáveis ao longo do tempo)
Fonte: Gráfico de velas por Lyakhovskiy Pavel - my job, CC BY-SA 3.0, https://commons.
gráfico de fluxo por Psychonaut, CC0, https://commons.wikimedia.org/w/index.
php?curid=20392905; gráfico em espiral por. Fign44, domínio público, https://
en.wikipedia.org/w/index.php?curid=32259670. Todos acessados em 18 jan, 2018
10 inker (1990, p. 9 de ne esquema como uma representaç o mnemônica (... que consiste
de uma descrição que contém ‘encaixes’ ou parâmetros para informação ainda não conhecida”.
Para o autor, a escolarização não explica a capacidade humana de compreender formas exóticas
(como as de visuali aç o de Big Data a partir de gr cos mais simples (como os do vestibular
ou do Excel . Os esquemas de gr cos derivariam, em ltima inst ncia, de um esquema geral
inato aparentado daquele que se revela no uso de dimensões espaciais para expressar variáveis
abstratas verbalmente nas línguas naturais (por exemplo, “o mercado está caindo” ou “tenho
larga experi ncia”). Embora Bazerman (2006) não compartilhe da abordagem cognitivista desses
autores, sua de niç o explicita que os g neros s o, modelos que utilizamos para explorar o não
familiar” (p. 23, nfases minhas), porém a palavra original utilizada por Bazerman (1997, p. 19)
que os tradutores substituíram por “modelo” é signpost, isto é, um marco de orientação espacial.
109
Gênero reloadinG
“Wind Map“, visualização criada por Fernanda Viégas (Google) e Martin Wattenberg. Os
“fios” representam a direção e intensidade do vento conforme dados extraídos de hora
em hora do serviço nacional de meteorologia norte-americano.
11 Ao clicar em diferentes seções do mapa, o leitor se aproxima de regiões especi cas e acompanha
o comportamento do vento.
110
Gênero reloadinG
12 Considerada por Edward Tufte uma das melhores VDs da história, essa visualização resume a
invasão da Rússia por Napoleão com poucos elementos visuais que agregam várias dimensões
(direção de ida e volta, posição, número de soldados, data e temperaturas ao longo da marcha).
13 O leitor pode escolher uma entre oito ocupações disponíveis no primeiro plano. Clicando sobre
as linhas ao fundo, ele pode ver de que pro ss o a linha trata e qual o valor naquele ponto. As
mudanças bruscas de inclinação nas curvas de emprego coincidem com épocas de diferentes
“revoluções tecnológicas”.
111
Gênero reloadinG
112
Gênero reloadinG
113
Gênero reloadinG
114
Gênero reloadinG
115
Gênero reloadinG
116
Gênero reloadinG
117
Gênero reloadinG
7. CONSIDERAÇÕES FINAIS
118
Gênero reloadinG
119
Gênero reloadinG
REFERÊNCIAS
120
Gênero reloadinG
121
Gênero reloadinG
Kennedy, H., Poell, T., & van Dijck, J. (2015). Data and agency. Big Data &
Society, 2(2). https://doi.org/10.1177/2053951715621569
Kitchin, R. (2014). Big Data, new epistemologies and paradigm shifts.
Big Data & Society, 1(1). https://doi.org/10.1177/2053951714528481
Kostelnick, C. (2007). The Visual Rhetoric of Data Displays: The
Conundrum of Clarity. IEEE Transactions on Professional Communication,
50(4), 280–294.
Latour, B. (1998). Writing Science - fact or fiction. In M. Callon, J. Law, &
A. Rip (Orgs.), Mapping the dynamics of science and technology: sociology
of science in the real world (Nachdr., p. 51–66). Houndmills: Macmillan.
Latour, B. (2000). Ciência em ação : como seguir cientistas e engenheiros
sociedade afora. (I. C. Benedetti, Trad.). São Paulo: Editora UNESP.
Lemke, J. L. (2002). Travels in hypermodality. Visual Communication, 1(3),
299–325.
Lemke, J. (2009). Multimodal genres and transmedia traversals: Social
semiotics and the political economy of the sign. Semiotica, 1/4(173),
283–297.
Manovich, L. (1999). Database as Symbolic Form. Convergence: The
International Journal of Research into New Media Technologies, 5(2), 80–99.
Manovich, L. (2000). Database as a genre of new media. AI & Society,
14(2), 176–183.
Manovich, L. (2001). The language of new media. Cambridge, Mass.: MIT Press.
Marcuschi, L. A. (2008). Produção textual, análise de gêneros e compreensão. São
Paulo: Parábola Editorial.
Mayer-Schönberger, V., & Cukier, K. (2013). Big data a revolution that
will transform how we live, work, and think. Boston: Houghton
Mifflin Harcourt. Recuperado de http://public.eblib.com/choice/
publicfullrecord.aspx?p=3304666
Metcalf, J., & Crawford, K. (2016). Where are human subjects in Big Data
research? The emerging ethics divide. Big Data & Society, 3(1). https://
doi.org/10.1177/2053951716650211
Oliveira, D. R. (2013, setembro 7). Fluxo das Emendas Parlamentares.
Recuperado 25 de janeiro de 2018, de http://blog.estadaodados.com/
fluxo-emendas-parlamentares/ Negroponte, N. (1995). Being digital
(1st ed). New York: Knopf.
Palmer, M. (2006, novembro 3). Data is the New Oil. Recuperado 26 de
janeiro de 2018, de http://ana.blogs.com/maestros/2006/11/data_is_
the_new.html
Panofsky, E. (1999). A Perspectiva como Forma Simbólica. (E. Nunes, Trad.).
Lisboa: Edicoes 70.
Pinker, S. (1990). A theory of graph comprehension. In R. O. Freedle (Org.),
Artificial intelligence and the future of testing (p. 73–126). Hillsdale, NJ:
Erlbaum [u.a.].
122
Gênero reloadinG
123