Você está na página 1de 104

Aula de Introdução à

Visualização de Dados

Prof. Dr. Rodrigo Cunha ‹ @rgcnha ›


Universidade Federal de Pernambuco (UFPE)
Universidad de Málaga (UMA)

Recife, out 2023


Rodrigo Cunha

Professor adjunto do Departamento de Comunicação


Universidade Federal de Pernambuco (UFPE); professor
permanente do Programa de Pós-Graduação em
Comunicação (PPGCOM/UFPE); líder do Grupo
Interdisciplinar de Pesquisa em Design da Informação
Jornalística (GRID). Em 2022-2023, foi pesquisador
visitante da Universidad de Málaga (UMA) para pesquisa
Twitter de pós-doutorado chamada DATOUCH – diretrizes
‹ @rgcnha › áudio-táteis para visualização de dados para pessoas
com deficiência visual. Consultor na Escola de Dados.
ufpe.br/grid • datouch.uma.es
Conceituação
Introdução à Visualização de Dados › Conceituação

“A representação e
apresentação de dados para
facilitar o entendimento”,
Data Visualization,
Andy Kirk, 2016.
Introdução à Visualização de Dados › Conceituação
O designer faz uso de marcas
(pontos, linhas, áreas) e atributos
(tamanho, cor, posição) para
representar os dados.

“A representação e
Dados são nomes, valores,
c grupos, valores estatísticos,
datas, comentários, localizações.

apresentação de dados para


facilitar o entendimento”,
Data Visualization,
Ao consumir a visualização, o
leitor passa por um processo
envolvendo três etapas:
percepção, interpretação e

Andy Kirk, 2016. compreensão.


Introdução à Visualização de Dados › Conceituação

“Nós visualizamos para comunicar uma


ideia. Também visualizamos para
adicionar legitimidade ec credibilidade.
Quando combinamos essas coisas e
contamosc histórias com números, temos
uma ferramenta poderosa de
comunicação”
Effective Data Visualization,
Stephanie D. H. Evergreen, 2016.
Introdução à Visualização de Dados › Conceituação

“Visualização de dados é uma exibição


de dados planejada para possibilitar
análise, exploração
c e descoberta.
Uma infografia é uma representação
visual com intenção de comunicar uma
ou mais mensagens específicas”,
The Truthful Art,
Alberto Cairo, 2016.
Introdução à Visualização de Dados › Conceituação

Cinco qualidades de uma visualização:


§ 1. Ser verdadeiro, honesto
§ 2. Ser funcional, representar
precisamente os dados
§ 3. Ser bonito, atrativo e intrigante
§ 4. Ser perspicaz, evidenciar o que seria
difícil de outra forma
§ 5. Ser esclarecedor, entender e aceitar
as evidências que traz
Hockey Stick Graph, Michael Mann et al., Nature, 1998
Evolução
Introdução à Visualização de Dados › Evolução
John Ogilby:
“The Road from London to
the City of Bristol”, 1675.

Britannia Atlas, 1675


Introdução à Visualização de Dados › Evolução
William Playfair:
1780-1781 “Exports and
Imports to and from
Denmark & Norway from
1700 to 1780”, 1801.

The Commercial and Political Atlas, 1801


Introdução à Visualização de Dados › Evolução
John Snow:
Cholera Map, 1854.

On the Mode of Communication of Cholera, 1854


Introdução à Visualização de Dados › Evolução
Charles Joseph Minard:
Napoleon March to and from Russia, 1812-1813

Charles Minard, 1869


Introdução à Visualização de Dados › Evolução
Otto and Marie Neurath, Gerd Arntz (ISOTYPE):
United States and Great Britain in the World

L. Secor Florence, Only an Ocean Between, 1943


Introdução à Visualização de Dados › Evolução
Harry C. Beck:
London Map Tube, 1933

London Underground, 1933


Um pouco de
estatística
Introdução à Visualização de Dados › Estatística

Uma pausa:
§ Como pesquisadores, estamos
interessados em encontrar resultados
que se apliquem a toda uma população
de pessoas ou coisas, mas...
§ coletamos dados de um pequeno
subconjunto de uma população
(chamado de amostra) e usamos essas
informações para inferir coisas sobre
toda a população
Introdução à Visualização de Dados › Estatística

§ John W. Tukey: explorar dados é, TIPOS DE DADOS


Numéricos

graficamente, “um trabalho de detetive” - Discretos (valores inteiros)


- Contínuos (valores quebrados)
Categóricos
- Nominais (categorias)
§ Ele criou praticamente um ramo inteiro - Ordinais (ordenação)

chamado de análise exploratória de


dados

§ Para ele, antes mesmo de testar suas


evidências, é essencial ter uma boa
ideia de como são seus dados

The Truthful Art, Alberto Cairo, 2016


Introdução à Visualização de Dados › Estatística

§ O processo de explorar visualmente os


dados se resume em encontrar padrões,
tendências e desvios nesses dados

§ Antes disso, vamos primeiro entender


alguns conceitos primordiais de
estatística descritiva, aquela que
descreve primeiro as características de
nossos dados: média, mediana e moda
Introdução à Visualização de Dados › Estatística

§ Média: é o resultado da soma de todos 1.2+1.4+1.8+2.1+2.1+2.4+2.7+3.6+3.8+


3.8+4.0+4.0+4.0+4.1+4.5+4.8+4.9+5.2+
os valores e da divisão do resultado pela 5.6 / 19 = 3.47
contagem total

§ Mediana: é o valor que divide nosso 1.2, 1.4, 1.8, 2.1, 2.1, 2.4, 2.7, 3.6, 3.8, 3.8,
4.0, 4.0, 4.0, 4.1, 4.5, 4.8, 4.9, 5.2, 5.6
conjunto de dados em duas metades

§ Moda: é o valor que aparece com mais 1.2, 1.4, 1.8, 2.1, 2.1, 2.4, 2.7, 3.6, 3.8, 3.8,
4.0, 4.0, 4.0, 4.1, 4.5, 4.8, 4.9, 5.2, 5.6
frequência em sua distribuição

The Truthful Art, Alberto Cairo, 2016


Introdução à Visualização de Dados › Estatística

§ Calcular a mediana, a média e a moda é


um bom ponto de partida para explorar
os dados
§ Sozinhos eles podem contar histórias
interessantes. Mas, na maioria dos
casos, não serão suficientes
§ Por exemplo, como podemos saber
quão próximas ou separados estão os
valores dentro de um conjunto de dados?
Introdução à Visualização de Dados › Estatística

§ A diferença entre o valor máximo e o valor


mínimo de uma distribuição é chamada de
intervalo

§ Em um histograma, os valores são


agregados em compartimentos (bins): é
possível visualizar a distribuição de dados.
Quantas escolas boas ou ruins existem?
Quantos estão agrupados em torno da
média nacional? Quantos estão perto da
meta de nota 6? E até quantas superam?

The Truthful Art, Alberto Cairo, 2016


Introdução à Visualização de Dados › Estatística

§ Existem outras formas de visualizar dados, que permitem ver


diferentes níveis de detalhes da mesma distribuição

The Truthful Art, Alberto Cairo, 2016


Introdução à Visualização de Dados › Estatística

Visualizando distribuições: variância e


desvio padrão

§ A variância apresenta o quão


longe — ou dispersos — os valores
estão em relação ao valor médio

§ Já o desvio padrão é calculado


partindo do resultado da variância.
Ele permite sabermos o quanto os
dados dentro de uma amostra varia
The Truthful Art, Alberto Cairo, 2016
Introdução à Visualização de Dados › Estatística

Distribuição normal:

§ Nenhum fenômeno da natureza segue


uma distribuição normal perfeita, mas
chega perto disso

§ Média, mediana e moda são iguais;


distribuição simétrica: metade acima e
baixo da média

§ Sabemos qual porcentagem de


pontuações está entre certos intervalos
The Truthful Art, Alberto Cairo, 2016
Introdução à Visualização de Dados › Estatística

§ Podemos medir a dispersão dos dados


começando com a mediana usando
percentis
§ Os percentis dividem sua distribuição
em centésimos e funcionam como
uma classificação
§ Os quartis usam os percentis 25, 50
(mediana) e 75. Eles dividem em
trimestres.
§ É possível resumir essas informações
num gráfico de caixa, uma
representação simplificada de uma
distribuição
The Truthful Art, Alberto Cairo, 2016
Representação
Introdução à Visualização de Dados › Representação

§ Codificação visual: codificar dados se


resume em duas propriedades – marcas
e atributos

§ As marcas são as formas visuais


utilizadas para representar os dados
(ponto, linha, plano, forma)

§ Os atributos são características e


variações dessas marcas (posição,
tamanho, área, ângulo)
The Truthful Art, Alberto Cairo, 2016
Introdução à Visualização de Dados › Representação

§ Se marcas e atributos são os ingredientes, os tipos de gráficos são as


receitas!

§ Cada gráfico é uma combinação distinta entre marcas e atributos; o


campo amadureceu e novas receitas são desenvolvidas

§ Algumas classificações ajudam a entender a função de cada gráfico

CHRTS

Data Visualization, Andy Kirk, 2016


Introdução à Visualização de Dados › Representação

Extreme Presentation, Andrew V. Abela trad. Kenneth Corrêa, 2007


Introdução à Visualização de Dados › Representação

Gráfico de Barras
§ Um gráfico de barras exibe
valores quantitativos para
diferentes itens de categoria.
O gráfico é composto por
marcas de linha (barras) com o
atributo de tamanho
(comprimento ou altura)
usado para representar o valor
quantitativo de cada item.
Introdução à Visualização de Dados › Representação

Gráfico de Barras Agrupado


§ Exibe valores quantitativos para
categorias primárias e
secundárias. O gráfico é
composto por marcas de linha
(barras) com o atributo de
tamanho (comprimento ou
altura). A cor também é usada
para distinguir ainda mais os
agrupamentos categóricos
secundários.
Introdução à Visualização de Dados › Representação

Gráfico de Bala

§ Efetivamente, é um gráfico
de barras exibindo valores
quantitativos para
diferentes categorias, mas
incorporando faixas de cor
adicionais para auxiliar na
interpretação das barras.
Introdução à Visualização de Dados › Representação

Gráfico Radial

§ Traça valores em múltiplas


variáveis quantitativas para
um ou vários itens
categóricos. Ele usa um
leiaute radial composto por
vários eixos que emergem
dos raios centrais de um
círculo, um para cada
variável.
Introdução à Visualização de Dados › Representação

Gráfico de Área Proporcional

§ É composto por marcas de forma com o atributo de tamanho


(área) usado para representar o valor quantitativo de cada item.
Um atributo de cor pode ser utilizado para acentuar a escala
quantitativa ou organizar distintas categorias.
Introdução à Visualização de Dados › Representação

Mapa de calor

§ Compreende dois eixos categóricos em um leiaute


tabular. As células abrigam marca de ponto com o
atributo de cor (brilho) para representar o valor
quantitativo associado.
Introdução à Visualização de Dados › Representação

Histograma
§ Exibe a frequência e a
distribuição de medições
quantitativas em valores
agrupados para itens de
dados. Enquanto os gráficos
de barras comparam
quantidades para categorias
nominais, um histograma
usa bins quantitativos para
formar agrupamentos de
valores ordinais.
Introdução à Visualização de Dados › Representação

Diagrama de Caixa

§ Indica (através da posição e


comprimento) cinco medidas
estatísticas diferentes: valores
do primeiro quartil (percentil
25), do segundo quartil (ou
mediana) e do terceiro quartil
(percentil 75).Os dois valores
estatísticos restantes variam
em definição: geralmente os
valores mínimo e máximo ou
os percentis 10 e 90.
Introdução à Visualização de Dados › Representação

Gráfico de Pizza

§ Um gráfico de pizza mostra como as


proporções de quantidades para diferentes
categorias. Ele usa um leiaute circular dividido
em setores para cada categoria, com o ângulo
representando as proporções percentuais e
atributos de cor para separar as categorias.
Introdução à Visualização de Dados › Representação

Gráfico de Donut

§ Alternativa para o gráfico de pizza, sem as


dificuldades cognitivas de área que possui
a versão anterior.
Introdução à Visualização de Dados › Representação

Gráfico Matrix de Pontos

§ Mostra como as proporções


de quantidades para
diferentes categorias
constituintes compõem um
todo. Cada proporção
constituinte é exibida por
meio de codificação por
cores do número relevante
de pontos.
Introdução à Visualização de Dados › Representação

Gráfico de Barras Empilhadas

§ Mostra como os valores


quantitativos para diferentes
categorias compõem um todo. A
proporção de cada “parte”
categórica é representada por
barras separadas que são
dimensionadas de acordo com sua
proporção quantitativa e depois
empilhadas para criar o todo. Às
vezes, o todo é padronizado para
representar 100%, caso contrário,
será representativo de um total
absoluto.
Introdução à Visualização de Dados › Representação

Mapa de Árvore

§ Diagrama que fornece exibição hierárquica com os valores


quantitativos de diferentes categorias. Usa um leiaute
retangular, representando o total de 100%. É dividido em
marcas de forma de tamanho proporcional para os valores
quantitativos associados a cada categoria.
Introdução à Visualização de Dados › Representação

Gráfico de Pizza Multinível (Sunburst)


§ Exibe relacionamentos hierárquicos e de parte-
de-um-todo em várias camadas de dimensões
categóricas. Usa camadas de anéis concêntricos.
Cada camada de anel é dividida em partes
quantitativas proporcionais para cada categoria.
Introdução à Visualização de Dados › Representação

Gráfico Rosa de Nightingale/Coxcomb

§ São desenhados em uma grade de coordenadas


polares. A distância que cada segmento se estende do
centro do eixo polar depende do valor que ele
representa. Assim, cada anel do centro da grade polar
pode ser usado como uma escala para traçar o
tamanho do segmento e representar o valor mais alto.
Introdução à Visualização de Dados › Representação

Diagrama de Venn
§ Mostra coleções e
relacionamentos entre vários
conjuntos. Ele normalmente usa
contêineres circulares para
representar todas as
permutações independentes e de
interseção com rótulos de valor
ou marcas de ponto usadas para
colocar todos os itens de
categoria no contêiner
apropriado.
Introdução à Visualização de Dados › Representação

Gráfico de Dispersão

§ Exibe a relação entre duas variáveis quantitativas para


diferentes itens de categoria. A exibição é formada por
marcas de pontos para cada item, plotadas
posicionalmente ao longo de cada eixo quantitativo.
Introdução à Visualização de Dados › Representação

Gráfico de Bolhas

§ Exibe a relação entre três variáveis quantitativas para


diferentes itens de categoria. Usa marcas de forma (geralmente
círculos) para cada item de categoria, plotadas ao longo de cada
eixo quantitativo com a variação no tamanho de cada marca
representando uma terceira medida quantitativa.
Introdução à Visualização de Dados › Representação

Diagrama de Rede
§ Exibem relacionamentos por meio das conexões entre
itens de dados. A versão comum desse tipo de
diagrama exibe itens como nós, representados por
marcas de pontos, com links ou arestas (representadas
por linhas) que descrevem a existência de uma
conexão.
Introdução à Visualização de Dados › Representação

Diagrama de Sankey
§ Exibem composição categórica e fluxos de relações quantitativas entre
diferentes dimensões ordinais principais. Faixas representam as
categorias de conexão (origem e destino) com espessuras de tamanho
proporcional representando o fluxo quantitativo dessa relação.
Introdução à Visualização de Dados › Representação

Diagrama de Cordas
§ É formado em torno de uma exibição radial com categorias
localizadas ao redor da borda: mostradas como nós
individuais ou como segmentos de arco dimensionados
proporcionalmente ao redor da circunferência para
representar uma divisão de parte-de-um-todo.
Introdução à Visualização de Dados › Representação

Gráfico de Linhas
§ Mostra como os valores quantitativos mudaram ao longo do tempo
para diferentes itens categóricos. Os gráficos de linha geralmente
são estruturados em torno de um eixo x temporal contínuo e um eixo
y quantitativo com valores plotados usando marcas de ponto em
coordenadas relevantes.
Introdução à Visualização de Dados › Representação

Gráfico de Coordenadas Paralelas


§ São ideais para comparar muitas variáveis e ver as
relações entre elas. Por exemplo, se você tivesse
que comparar uma série de produtos com os
mesmos atributos.
Introdução à Visualização de Dados › Representação

Gráfico de Área
§ Mostra como os valores quantitativos mudaram ao longo do tempo
para um único item categórico. Os gráficos são normalmente
estruturados em torno de um eixo x temporal contínuo e um eixo y
quantitativo com valores plotados usando marcas de ponto em
coordenadas relevantes.
Introdução à Visualização de Dados › Representação

Gráfico de Área Empilhada


§ Mostra como os valores quantitativos mudaram ao longo do tempo
para vários itens categóricos. Linhas de conexão unem itens
adjacentes e relacionados para formar inclinações que são
estendidas ao longo de toda a escala de tempo para exibir uma
mudança completa ao longo do tempo.
Introdução à Visualização de Dados › Representação

Gráfico de Fluxo
§ Mostra como os valores quantitativos mudaram ao longo do tempo para vários
itens categóricos. Geralmente são usados ​quando você tem muitas categorias
concorrentes e constituintes em um determinado ponto no tempo e essas
categorias podem começar e parar em diferentes pontos no tempo, em vez de
continuar durante todo o período de tempo apresentado.
Introdução à Visualização de Dados › Representação

Gráfico de Gantt
§ Comumente usado como ferramenta de
gerenciamento, exibe uma lista de atividades (ou
tarefas) com a duração ao longo do tempo, os
projetos quando sua atividade começa e termina.
Introdução à Visualização de Dados › Representação

Candlestick (Gráfico de Velas)


§ Usado como uma ferramenta de negociação para
visualizar e analisar os movimentos de preços ao longo
do tempo para títulos, derivativos, moedas, ações,
títulos, commodities, etc.
Introdução à Visualização de Dados › Representação

Mapa Coroplético

§ Exibem áreas geográficas divididas ou regiões


coloridas, sombreadas ou padronizadas em
relação a uma variável de dados.
Introdução à Visualização de Dados › Representação

Mapa de Pontos

§ Os mapas de pontos são uma maneira de detectar padrões


espaciais ou a distribuição de dados em uma região geográfica,
colocando pontos de tamanhos iguais em uma região geográfica.
Introdução à Visualização de Dados › Representação

Mapa de Bolhas

§ Aqui, os círculos são exibidos em uma região geográfica


designada com a área de cada círculo sendo proporcional
ao seu valor no conjunto de dados.
Introdução à Visualização de Dados › Representação

Mapa de Fluxo

§ Mostram geograficamente o movimento de informações ou objetos


de um local para outro e sua quantidade. Normalmente, são usados
para mostrar os dados de migração de pessoas, animais e produtos.
Introdução à Visualização de Dados › Representação

Repositórios

§ The Data Visualization Catalogue


http://datavizcatalogue.com
§ Data Viz Project
http://datavizproject.com
§ FT Visual Vocabulary
http://ft-interactive.github.io/visual-vocabulary
§ Chart Chooser
http://extremepresentation.com/chart_selector_
Prática
Introdução à Visualização de Dados › Prática

Processo Dataviz (Stephen Fry, 2008)

§ Acquire (obtenção dos dados);


§ Parse (analisar os dados; converter formatos);
§ Filter (separar itens relevantes para a matéria);
§ Mine (análise estatística; mineração de dados);
§ Represent (decidir pela representação visual);
§ Refine (design; estabelecer cor, hierarquia);
§ Interact (interação; exploração dos dados).
Introdução à Visualização de Dados › Prática

Domínios

§ Creative coding: criação de arte generativa ou visualização de dados


mais expressivas que incluem recursos visuais, áudio e movimento.
Domínio de JavaScript e WebGL; D3 c

§ Design de jogos: desenvolver narrativas com domínio de ferramentas


que lidam com elementos 3D (three.js), física (matter.js) e com engines
de jogos (como o Phaser e o PixiJS)

§ Outros domínios: experiência com realidade virtual ou aumentada,


tratamento de dados (usando Python,
c R ou até planilhas) e com
sistemas de mapas, como QGIS, Leaflet ou Mapbox.
Introdução à Visualização de Dados › Prática

Onde se formar/informar?

§ Escola de Dados:
http://escoladedados.org

§ DataCamp:
http://www.datacamp.com

§ Knight Center:
http://journalismcourses.org

§ Data Visualization Society:


https://www.datavisualizationsociety.com
Introdução à Visualização de Dados › Prática

Premiações

§ SND Best of Digital Design


http://www.snd.org/bodd

§ SND-E Malofiej
http://www.malofiejgraphics.com

§ ONA Awards
http://awards.journalists.org

§ GEN Data Journalism Awards


http://datajournalismawards.org
Introdução à Visualização de Dados › Prática

Ferramentas

§ Microsoft Power BI › http://powerbi.microsoft.com


§ Tableau › http://www.tableau.com
§ Datawrapper › http://www.datawrapper.de
§ Infogram › http://www.infogram.com
§ Highcharts › https://www.highcharts.com
§ D3.js (javascript+css+svg) › http://d3js.org
Introdução à Visualização de Dados › Prática

Twitter
§ NYT Graphics @nytgraphics § Alberto Cairo @albertocairo

§ Post Graphics @PostGraphics § Fabio Takahashi @tak_fabio


§ Rodrigo Menegat @RodrigoMenegat
§ Guardian Visuais @GuardianVisuals
§ Simon Ducroquet @Ducroquet
§ FT Data @ftdata
§ Adriano Belisario @Belisards
§ Bloomberg Graphics @BBGVisualData
§ Cecília do Lago @ceciliadolago
§ L.A. Times Graphics @LATimesGraphics
§ Sérgio Spagnuolo @sergiospagnuolo
§ WSJ Graphics @WSJGraphics
§ Judite Cypreste @juditecypreste
§ Reuters Graphics @ReutersGraphics
§ Gabriel Zanlorenssi @gzanlorenssi
§ Estadão Dados @estadaodados
§ Marcelo Soares @msoares
§ DeltaFolha @deltafolha
§ Natalia Mazotte @NataliaMazotte
§ LA NACION Data @LNData § Daniel Bramatti @bramatti
Introdução à Visualização de Dados › Prática

Aplicações
§ Trabalho de Diana Yukari,
Daniel Mariani, Flávia Faria e
João Pedro Pitombo, na Folha
de S.Paulo
§ Utilizaram um diagrama
ternário para explicar a
composição das bancadas
legislativas a partir de 2023

Folha de S.Paulo, 2 nov 2022


Introdução à Visualização de Dados › Prática

Aplicação
§ Mapa que identifica movimento de forças
para comparação de crescimento/
decrescimento

Washington Post, 28 jan 2022 / Folha de S.Paulo, 2 nov 2022 / NYTimes, 14 nov 2022
Introdução à Visualização de Dados › Prática

Aplicação
§ Trabalho de Cristiano Martins,
Daniel Mariani e Diana Yukari,
na Folha de S.Paulo
§ Comparação da quantidade de
partidas disputadas por times
brasileiros ao longo do ano em
relação aos demais

Folha de S.Paulo, 30 jan 2022


Introdução à Visualização de Dados › Prática

Aplicação
§ Contar uma história/temporal-
quantitativa a partir de uma
diagrama de linha

NYTimes, 27 jan 2022 / Bloomberg, 27 jan 2022


Introdução à Visualização de Dados › Prática

Aplicação
§ Apuração dos midterms nos EUA
§ Uso do mapa para identificar a
quantidade de cadeiras e quais
foram ocupadas por democratas
e por republicanos
§ Se trata de uma representação
inexatamente geográfica ao
qual o tamanho do Estado não
interfere na percepção visual
como um todo
The Guardian, 10 nov 2022
Introdução à Visualização de Dados › Prática

Aplicação
§ Visualização de dados inclusiva:
WCAG
uso de demais sentidos para
acessibilidade de informações ARIA
gráficas a pessoas com
deficiência visual
§ Os dados são também para ver,
ouvir (sonificação), tocar (háptica)
e cheirar (olfação)
§ Em busca de tecnologias mais
acessíveis e baratas para
acessibilidade: assistivas
viScent, Human-Computer Interaction Lab (HCIL), 2018
Cores
Introdução à Visualização de Dados › Cores

§ Assunto teórico enraizado na ótica – ramo


da física que se dedica ao estudo do
comportamento e das propriedades da luz

§ Lidar com cores na visualização quase


sempre é entender como se processa a
dinâmica delas no computador
§ Existem alguns padrões estabelecidos
como o RGB (red, green, blue), o CMYK
(ciano, magenta, yellow, black) e o
hexadecimal (#RRGGBB).
Introdução à Visualização de Dados › Cores

§ Entretanto, um dos modelos mais


acessíveis para entendermos a aplicação
de cor na visualização de dados é o HSL
(hue, saturation, lightness) – Munsell, s. 20
§ Hue (matiz): a cor verdadeira, rotulada,
atributo qualitativo da cor, definida pela
diferença e não por uma escala
§ Saturation (saturação): define a pureza ou
a vivicidade de um matiz
§ Lightness (brilho): mais claro/mais escuro
Encyclopedia Britannica, 2012
Introdução à Visualização de Dados › Cores

§ Existem maneiras distintas


de usar cores para
representar valores,
dependendo se mostram
dados quantitativos ou
categóricos
§ Escala quantitativa: uso do
brilho é a abordagem mais
comum para diferenciar
quantidades; o leitor deve
diferenciar um valor maior
ou menor
The New York Times, out 2014
Introdução à Visualização de Dados › Cores

§ Às vezes, a forma e o alcance


dos dados pode justificar o
uso de uma escala de cores
divergente (matiz), para
separar pontos divergentes
como, por exemplo, um valor
acima ou abaixo de zero ou
dois lados de um limite
significativo

Berliner Morgenpost, nov 2014


Introdução à Visualização de Dados › Cores

§ Erro comum: representar


dados quantitativos com
uma escala muito gama de
cores. Você é capaz de
perceber relação de
quantidade no mapa ao lado?
§ Enquanto há uma implicação
geral de mais frio (azul) e
mais quente (vermelho), a
presença de outros tons
obstrui a consistência na
lógica
Australian Bureau of Meteorology, jan 2013
Introdução à Visualização de Dados › Cores

§ Classificações categóricas:
o importante é criar uma
distinção clara e visível
entre cada categoria
§ Lembre-se: você não está
insinuando qualquer noção
de ordem ou magnitude, só
quer ajudar o leitor a
distinguir cada categoria
§ Considera-se aqui, a
variação do matiz The Washington Post, dez 2012
Introdução à Visualização de Dados › Cores

§ Algumas vezes, dados categóricos são sobre categorias de cores,


literalmente; pode haver uma relação explícita e imediata entre as
cores que você usa e os valores dos dados associados

Colors of the Rails, Nicholas Rougeux, 2016


Introdução à Visualização de Dados › Cores

§ Categorias ordinais são um pouco


diferente das categorias nominais,
pois há propriedades de ordem
§ Você está se esforçando não apenas
Rim Fire, NASA Earth Observatory, 2013

em criar uma distinção, como


também relação hierárquica
§ Por exemplo, em questões como
concordo/discordo, o leitor deve
distinguir o equilíbrio geral entre
cada sentimento
Depict Data Studio, Ann K. Emery, 2017
Introdução à Visualização de Dados › Cores

§ Criar algo que seja agradável aos


olhos e igualmente adequado ao
propósito funcional é um equilíbrio
difícil de alcançar
§ Embora se possa criar um trabalho
elegante com uma paleta de cores
limitada, justificar o uso de cores não
é o mesmo que restringir
desnecessariamente o uso delas

Wind Map, Fernanda Viegas & Martin Wattenberg, 2012


Introdução à Visualização de Dados › Cores

§ O campo da cartografia tem um


olhar fascinante de detalhado sobre
o uso de cores: como comunicar
tantos detalhes numa visualização?
§ Importante observar a escolha das
cores em demais elementos, como
linhas e rótulos de texto
§ São elementos sensíveis devido à
proximidade das cores já atribuídas
aos valores de dados
Americae Peruvi Aque Ita ut Postremum Detecta Traditur Recens Delineatio, Cornelis de Jode, 1578
Introdução à Visualização de Dados › Cores

Fatores importantes
§ Meio: o formato de saída afetará as
escolhas de cores e como elas são
percebidas
§ Guidelines: observar diretrizes de cores
potencialmente restritivas
§ Propósito: que tom você está tentando
transmitir e como as escolhas de cores
podem moldar isso?
§ Acessibilidade: atenção a possíveis
deficiências visuais em seu público TwoTone Creative, 2018
Introdução à Visualização de Dados › Cores

Algumas ferramentas
§ Vischeck é uma maneira de mostrar como as coisas se parecem para
alguém que é daltônico › http://www.vischeck.com
§ Adobe Color é um aplicativo de internet que permite experimentar,
criar e salvar vários esquemas de cores › http://color.adobe.com
§ Em I Want a Hue, gere e refine paletas de cores perfeitamente distintas
para visualização e acessibilidade › http://medialab.github.io/iwanthue
§ ColorBrewer é uma ferramenta simples, mas essencial, que gera
esquemas de cores graduados para mapas coropléticos ›
http://colorbrewer2.org
Ética
Introdução à Visualização de Dados › Ética
Introdução à Visualização de Dados › Ética
Introdução à Visualização de Dados › Ética
Introdução à Visualização de Dados › Ética
Introdução à Visualização de Dados › Ética
Introdução à Visualização de Dados › Ética
Referências
Introdução à Visualização de Dados › Referências

BERTIN/TUKEY/CLEVELAND
§ Semiology of Graphics, 1967
§ Exploratory Data Analysis, 1977
§ The Elements of Graphics Data, 1983
Introdução à Visualização de Dados › Referências

EDWARD R. TUFTE
§ The Visual Display of Quantitative Information, 1983
§ Envisioning Information, 1990
§ Visual Explanations, 1997
§ Beautiful Evidence, 2006
Introdução à Visualização de Dados › Referências

KIRK/FRY/KNAFLIC/MEIRELLES
§ Data Visualization, 2016
§ Visualizing Data, 2008
§ Storytelling com Dados, 2018
§ Design for Information, 2013
Introdução à Visualização de Dados › Referências

CAMÕES/STEELE/YAU/EVERGREEN
§ Data at Work, 2016
§ Beautiful Visualization, 2010
§ Visualize This, 2016
§ Effective Data Visualization, 2016
Introdução à Visualização de Dados › Referências

WHEELAN/REINHART/ROWNTREE/FIELD
§ Naked Statistics, 2014
§ Statistics Done Wrong, 2015
§ Statistics without Tears, 2018 [1982]
§ Discovery Statistics using R, 2010
Introdução à Visualização de Dados › Referências

CAIRO/HUFF
§ How Charts Lie, 2019
§ Como Mentir com Estatística, 2016 [1954]
Obrigado!
Perguntas?

Prof. Dr. Rodrigo Cunha ‹ @rgcnha ›


Universidade Federal de Pernambuco (UFPE)
Universidad de Málaga (UMA)

Recife, out 2023

Você também pode gostar