Você está na página 1de 22

Storytelling com dados

Visualizando dados

Quem?
Essa tarefa é normalmente realizada pela equipe de
analistas de dados e data scientists

No ambiente de negócios, dados geram valor quando permitem que empresas e


gestores tomem decisões melhores, mais rapidamente e ao menor custo possível.
Talvez, a maior parte dessas decisões sejam (e serão) ainda tomadas por pessoas,
de modo que os dados atuam como uma ferramenta de suporte à decisão.

Há outra forma de geração de valor com base em dados, que são as decisões
tornadas possíveis por algoritmos de inteligência artificial, que podem ter um
caráter mais operacional, como um modelo de previsão de fraude, ou ter uma
função mais tática e estratégica, como os modelos de previsão de vendas, por
exemplo.

Aqui, vamos discutir técnicas e ferramentas que auxiliam no primeiro caso, isto é, na
tomada de decisão e geração de valor a partir da exploração visual dos dados no
dia a dia das empresas.

Contudo, o domínio de técnicas de visualização de dados que discutiremos também


é essencial para profissionais que buscam se especializar na criação e aplicação de
algoritmos e ferramentas automatizadas de ciência de dados.

Tradicionalmente, a visualização de dados e de indicadores empresariais foi


amplamente dominada pela criação de gráficos e tabelas em planilhas Excel e seu
compartilhamento em relatórios ou apresentações de slides.

Porém, há muito mais em visualização de dados do que


criar um gráfico em Excel.

_____________________________________________________________________________________________________________________________________

Este documento é de uso exclusivo dos clientes e parceiros da Indicium Tecnologia de Dados LTDA
e não deve ser reproduzido ou compartilhado sem autorização expressa da Indicium.
1
No mínimo, fatores como contexto, audiência e objetivos devem ser priorizados
antes da criação da visualização em si. E, para se tornar um especialista em
visualização de dados, é preciso saber contar histórias a partir deles.

Como fazemos isso?

A visualização de dados de qualidade é uma combinação de tecnologia, design e


entendimento de negócio. A incrível oferta de opções de gráficos e visuais nas
planilhas e ferramentas de BI modernas é tanto uma sina quanto uma dádiva.

Sem ter um caminho claro, podemos seguir pelas nebulosas visualizações que mais
atrapalham do que ajudam, como os gráficos em 3D, os gráficos de pizza sem
qualquer significado, as cores que confundem etc. (KNAFLIC, 2015).

Exemplo - Não faça isso


Fonte: educba.com/3d-plot-in-excel

A visualização de dados não se resume às escolhas de gráficos e cores. O processo


se inicia com a identificação do contexto (o que queremos apresentar?) e do uso
(queremos explorar ou explicar?) para, só em seguida, pensarmos no meio (será um
relatório ou um dashboard?).

A criação dos elementos visuais em si deve levar em conta a hierarquia do que


queremos explorar ou explicar e utilizar as técnicas de design para reforçar pontos e
reduzir a poluição visual. E, mais importante, esse processo independe da
ferramenta que utilizaremos e pode ser seguido tanto em uma planilha de Excel
como em um painel de Tableau ou em um relatório escrito inteiramente em Python.
Como diz um princípio famoso do design, a forma segue a função.

_____________________________________________________________________________________________________________________________________

Este documento é de uso exclusivo dos clientes e parceiros da Indicium Tecnologia de Dados LTDA
e não deve ser reproduzido ou compartilhado sem autorização expressa da Indicium.
2
Em resumo, vamos dividir este tema em cada umas das etapas do processo de
visualização de dados:

1. qual é o contexto da visualização?


- definir público-alvo, tipo de análise, indicadores etc.

2. qual é o meio mais adequado?


- estruturar um dashboard ou um relatório: flexibilidade vs complexidade.

3. quais são os elementos visuais mais interessantes?


- utilizar cada elemento visual para responder as perguntas certas.

4. como melhorar o entendimento utilizando técnicas de design?


- utilizar cores e fontes, aproveitar bem o espaço etc.

Na sequência, apresentaremos exemplos práticos utilizando ferramentas modernas


de visualização de dados. Todos eles foram criados utilizando o Google Sheets.

Definindo o contexto

Toda e qualquer visualização de dados inicia-se com a definição de uma pergunta


que queremos responder. No ambiente empresarial, essa pergunta é geralmente

_____________________________________________________________________________________________________________________________________

Este documento é de uso exclusivo dos clientes e parceiros da Indicium Tecnologia de Dados LTDA
e não deve ser reproduzido ou compartilhado sem autorização expressa da Indicium.
3
relacionada a um ou mais problemas de algum processo de negócios, como vendas,
recursos humanos, financeiro, suporte etc.

Por exemplo, vamos supor que nós fomos contratados pelo gerente de vendas da
Northwind, e que ele quer melhorar o desempenho das vendas nas diferentes
divisões de negócio. Para esse problema, podemos elaborar diferentes perguntas
que podem nos ajudar na tomada de decisão:

O segundo passo na definição do contexto é entender se nosso objetivo é responder


uma pergunta, o que chamamos de análise explanatória, ou se queremos permitir
que outra pessoa responda essa pergunta de forma interativa, o que chamamos de
análise exploratória.

No primeiro caso, geralmente, faremos uso de relatórios estáticos. No segundo,


podemos utilizar dashboards interativos em ferramentas de BI.

É possível ainda que ambos sejam necessários: podemos ter que gerar um relatório
mensal explicando tendências e oportunidades e, ao mesmo tempo, criar um
dashboard atualizado diariamente para acompanhamento de metas e indicadores.

O importante é que fique clara para você a diferença entre ambos, que vai impactar
no meio, visuais, filtros etc. que iremos utilizar.

Outra parte essencial do contexto é a audiência. Ou seja, a complexidade de uma


visualização deve ser pensada relativamente ao conhecimento técnico da pessoa
que a receberá ou utilizará no futuro.
Em geral, devemos sempre simplificar mais do que complicar. Isso não significa
omitir nem remover dados essenciais para a tomada de decisão, mas utilizar as
técnicas corretas para facilitar a atenção da audiência.

_____________________________________________________________________________________________________________________________________

Este documento é de uso exclusivo dos clientes e parceiros da Indicium Tecnologia de Dados LTDA
e não deve ser reproduzido ou compartilhado sem autorização expressa da Indicium.
4
Como veremos futuramente, o bom uso do espaço vazio, de elementos gráficos,
hierarquias, fontes etc. é essencial para que uma visualização tanto seja agradável
quanto passe a informação de forma eficiente.

Escolhendo o formato

A partir do contexto da visualização, definimos qual formato utilizaremos.


Tipicamente, o formato será algum tipo de relatório estático (um documento ou
uma apresentação de slides, por exemplo) ou um dashboard interativo (como um
painel em uma ferramenta de BI).

A escolha entre um desses dois parte principalmente do tipo de análise: para fins de
análise exploratória, as ferramentas de BI, ou mesmo planilhas bem elaboradas,
permitem visualizar grandes volumes de dados com grande flexibilidade, alterando
filtros e agrupamentos para gerar insights rapidamente. Por outro lado, quando
queremos explicar tendências ou análises, o ideal é utilizar relatórios em que a
história é contada de uma forma bem desenhada e com filtros e agrupamentos bem
definidos.

Vale a pena reforçar: a forma segue a função.

Não é porque utilizamos uma nova ferramenta com dezenas de visuais ou um


notebook em Python ou R que necessariamente teremos uma visualização de
qualidade. Pelo contrário. Essas ferramentas só geram valor quando usadas de
forma adequada e dentro de um processo bem definido.

Para muitos casos, uma apresentação em PowerPoint bem estruturada, com


gráficos criados seguindo as melhores práticas, pode ser mais do que suficiente. As
técnicas avançadas de visualização de dados podem, sim, ser utilizadas desde que
você se lembre de que elas são ferramentas, não um fim em si.

_____________________________________________________________________________________________________________________________________

Este documento é de uso exclusivo dos clientes e parceiros da Indicium Tecnologia de Dados LTDA
e não deve ser reproduzido ou compartilhado sem autorização expressa da Indicium.
5
Outros pontos importantes na hora de estruturar a formatação é levar em conta os
objetivos e a audiência. Indicadores estratégicos, em geral, cabem melhor em
relatórios ou dashboards mais resumidos. Já quando o objetivo é visualizar
indicadores operacionais, pode ser necessário incluir gráficos mais detalhados e em
maior quantidade.

O planejamento é essencial e, para isso, podemos utilizar ferramentas simples,


como quadros e post-its para estruturar e organizar as perguntas que queremos
explorar ou responder em cada projeto.

No nosso projeto da Northwind, uma boa ideia pode ser um dashboard para
visualizar as principais métricas da área comercial da empresa. Assim, podemos
explorar os diferentes agrupamentos e filtros para responder as perguntas de nosso
gestor.

Nesse momento, ainda não sabemos qual ferramenta utilizar, mas já podemos
seguir um padrão do geral para o específico:

_____________________________________________________________________________________________________________________________________

Este documento é de uso exclusivo dos clientes e parceiros da Indicium Tecnologia de Dados LTDA
e não deve ser reproduzido ou compartilhado sem autorização expressa da Indicium.
6
Para facilitar, podemos fazer um desenho simplificado do layout do dashboard com
perguntas que queremos responder:

_____________________________________________________________________________________________________________________________________

Este documento é de uso exclusivo dos clientes e parceiros da Indicium Tecnologia de Dados LTDA
e não deve ser reproduzido ou compartilhado sem autorização expressa da Indicium.
7
Utilizando elementos gráficos
A concretização da visualização é uma apresentação visual de dados e informações
utilizando elementos gráficos. Contrário ao que muitos podem pensar, esses
elementos não se resumem ao que chamamos geralmente apenas de gráficos, pois
também incluem outros elementos visuais, como textos, tabelas, diagramas etc.

A escolha do elemento mais apropriado é uma das decisões mais difíceis e


importantes da visualização de dados.

Exemplo de combinação de elementos visuais


Fonte: The Economist (apud Tableau).

Aqui vale mais uma vez reforçar: o objetivo da visualização de dados é permitir e
facilitar a tomada de decisão a partir dos dados. Para isso, devemos utilizar as
ferramentas, os gráficos e as técnicas de design adequadas a fim de facilitar e
realçar as informações mais relevantes dentro do contexto a que nos propusemos
essa tarefa.

Todos os elementos incluídos devem ser pensados dessa forma, utilizando-se


sempre o que for mais adequado e evitando-se grandes inovações, que tenham um

_____________________________________________________________________________________________________________________________________

Este documento é de uso exclusivo dos clientes e parceiros da Indicium Tecnologia de Dados LTDA
e não deve ser reproduzido ou compartilhado sem autorização expressa da Indicium.
8
caráter puramente estético, mas que não sirvam para o objetivo. Ou seja, há um
motivo para que tabelas e gráficos de barras sejam tão utilizados, e não devemos ter
medo de usá-los.

Isso não quer dizer que não devemos buscar a beleza em nossos visuais, muito pelo
contrário. Está comprovado que gráficos esteticamente bonitos facilitam a
compreensão e aumentam o engajamento da audiência. Em seu clássico livro Visual
display of quantitative information, Edward Tufte argumenta que o gráficos devem:

- mostrar os dados;
- induzir o leitor a pensar sobre a substância, não sobre a metodologia, o
design, técnica gráfica etc.;
- evitar distorcer o que os dados querem dizer;
- tornar grandes bases de dados coerentes;
- revelar os dados em diferentes níveis de detalhe, desde uma visão geral até
detalhes finos;
- ter um propósito claro: descrição, exploração, tabulação ou decoração;
- ser intimamente integrado com a descrição verbal e estatística dos dados.

Embora as ferramentas gráficas modernas possam conter dezenas de elementos


gráficos distintos, na grande maioria dos casos, os gráficos mais tradicionais são os
mais adequados.

Exemplos de Gráficos
Fonte: Indicium Academy

_____________________________________________________________________________________________________________________________________

Este documento é de uso exclusivo dos clientes e parceiros da Indicium Tecnologia de Dados LTDA
e não deve ser reproduzido ou compartilhado sem autorização expressa da Indicium.
9
Gráficos de linhas

Provavelmente, são os mais utilizados na visualização de dados, além de estarem


entre os mais antigos. Eles servem para plotar dados que apresentam continuidade
entre si, especialmente os relativos a tempo, como: dias, meses, anos etc. Por esse
motivo, também são chamados frequentemente de gráficos de séries temporais.

Os gráficos de linhas são uma das formas mais antigas de se visualizar dados,
como este:

Gráfico de William Playfair do Século XVIII


Fonte: Edward Tufte

Como queremos demonstrar continuidade, em geral, não é recomendado utilizar


gráficos de linhas para comparação de categorias. Além disso, é importante que os
intervalos no eixo x tenham a mesma variação:

Exemplos de Gráficos de Linhas - com uma e duas séries temporais


Fonte: Indicium Academy

_____________________________________________________________________________________________________________________________________

Este documento é de uso exclusivo dos clientes e parceiros da Indicium Tecnologia de Dados LTDA
e não deve ser reproduzido ou compartilhado sem autorização expressa da Indicium.
10
Um erro comum em gráficos de linhas é tentar incluir séries demasiadamente,
criando o que chamamos de gráfico espaguete. O resultado é uma visualização de
dados pouco informativa e de pouca ou nenhuma utilidade.

Entre as opções para evitar esse problema, podemos realçar uma ou mais séries de
interesse e esconder as demais com uma cor de menor hierarquia (cinza, por
exemplo).

Gráfico espaguete tem pouco valor na prática


Fonte: Indicium Academy

_____________________________________________________________________________________________________________________________________

Este documento é de uso exclusivo dos clientes e parceiros da Indicium Tecnologia de Dados LTDA
e não deve ser reproduzido ou compartilhado sem autorização expressa da Indicium.
11
Realçar a série de interesse quando há muitas séries de dados
Fonte: Indicium Academy

Resumir muitas séries em uma estatística descritiva, como a média


Fonte: Indicium Academy

Gráficos de barras

Outro muito utilizado é o gráfico de barras, que pode ser horizontal, vertical,
empilhado etc. E não é por acaso, pois esse tipo de visualização é muito intuitivo
para comparações entre um número pequeno de categorias.

É um gráfico que traz a noção de escala nas diferenças que não conseguimos obter
por meio de tabelas.

_____________________________________________________________________________________________________________________________________

Este documento é de uso exclusivo dos clientes e parceiros da Indicium Tecnologia de Dados LTDA
e não deve ser reproduzido ou compartilhado sem autorização expressa da Indicium.
12
Gráficos de colunas
Os gráficos de barras verticais ou de colunas são provavelmente a versão mais
utilizada para comparativos entre categorias. No entanto, a facilidade em comparar
rapidamente as barras nos gráficos pode causar problemas caso a escala do eixo y
não seja o padrão iniciado em 0, já que, em muitos casos, o leitor assumirá esse
entendimento sem ler com calma os valores da escala.

Por esse motivo, é essencial que os gráficos de colunas


sempre se iniciem em 0.

Gráficos de barras horizontais


É o mais adequado para demonstrar a noção de ranqueamento entre categorias e,
por esse motivo, é também o substituto perfeito para os famigerados gráficos de
pizza.

Note, no gráfico a seguir, como a comparação entre países fica facilitada ao


utilizarmos o gráfico de barras horizontais, já que o próprio ordenamento do gráfico
nos traz essa informação:

_____________________________________________________________________________________________________________________________________

Este documento é de uso exclusivo dos clientes e parceiros da Indicium Tecnologia de Dados LTDA
e não deve ser reproduzido ou compartilhado sem autorização expressa da Indicium.
13
Exemplo de gráfico de barras horizontais
Fonte: Indicium Academy

Quando colocamos lado a lado um gráfico de barras e um de pizza, fica ainda mais
claro por que a escolha pelo primeiro. Comparando-se grandezas parecidas, é
visualmente difícil identificar padrões nos gráficos de pizza. Se essas grandezas
forem distintas o suficiente, o gráfico de barras funcionará ainda melhor que o de
pizza:

Ou seja: não use gráficos de pizza.

_____________________________________________________________________________________________________________________________________

Este documento é de uso exclusivo dos clientes e parceiros da Indicium Tecnologia de Dados LTDA
e não deve ser reproduzido ou compartilhado sem autorização expressa da Indicium.
14
Gráficos de dispersão
Para visualizar a relação entre duas variáveis numéricas, como para identificar
tendências, o gráfico de dispersão (ou scatterplot) é um dos mais adequados.

Gráfico de dispersão
Fonte: Indicium Academy

Tabelas
Não raramente o que parece ser mais simples seja também o mais adequado. As
tabelas são muito importantes na visualização de dados e não é porque são comuns
que devem ser menosprezadas.

Utilizar gráficos para apresentar grandezas que não são comparáveis entre si é um
mau uso de técnicas de visualização. Nesse caso, fique com as tabelas.

_____________________________________________________________________________________________________________________________________

Este documento é de uso exclusivo dos clientes e parceiros da Indicium Tecnologia de Dados LTDA
e não deve ser reproduzido ou compartilhado sem autorização expressa da Indicium.
15
Em alguns casos, utilizar gráficos prejudica o entendimento
Fonte: Indicium Academy

Um ponto importante ao utilizar tabelas é entender que nós lemos tabelas da


mesma forma que lemos texto: de cima para baixo, da esquerda para direita (isso
nos países ocidentais).

Assim como um bom design de livro ou artigo é pensado para que se foque na
história, uma tabela bem feita ressalta os dados que ela contém, não suas bordas,
cores etc.

Falando em cores, elas são uma opção um pouco mais visual na categoria das
tabelas para realçar padrões nos dados no chamado mapa de calor (heatmap). Esse
tipo de elemento gráfico é interessante para tabelas com muitas categorias e
métricas distintas e que queremos identificar outliers rapidamente.

_____________________________________________________________________________________________________________________________________

Este documento é de uso exclusivo dos clientes e parceiros da Indicium Tecnologia de Dados LTDA
e não deve ser reproduzido ou compartilhado sem autorização expressa da Indicium.
16
Mapas de calor podem realçar outliers
Fonte: Indicium Academy

Textos
Quando queremos realçar um número específico ou indicadores que resumem muita
informação em si mesmos (como totais, médias etc.), o uso de textos pode ser o
mais adequado.
Desenvolvendo um painel de BI, por exemplo, é comum utilizar visuais de texto
(scorecards) na área superior dele para facilitar a visualização rápida dos
indicadores mais importantes.
Os elementos textuais podem incluir também informações sobre variações
comparativas, facilitando o entendimento sem a necessidade de utilização de um
gráfico.

Exemplos de Scorecards
Fonte: Indicium Academy

Mapas
Os mapas são elementos naturalmente adequados para visualização de dados com
dimensões geográficas. O uso desses elementos hoje é possível na grande maioria
das ferramentas de visualização sem necessidade de processamentos adicionais.

Há duas formas principais de visualização de mapas: o mapa regional (ou


coroplético) e o mapa de marcadores. Embora sejam visualmente bonitos, quando
queremos uma comparação mais precisa entre os valores em si, gráficos e tabelas
ainda são preferíveis.

_____________________________________________________________________________________________________________________________________

Este documento é de uso exclusivo dos clientes e parceiros da Indicium Tecnologia de Dados LTDA
e não deve ser reproduzido ou compartilhado sem autorização expressa da Indicium.
17
Mapas regionais são ideais quando os dados que queremos visualizar fazem
sentido em regiões bem definidas (como cidades, países, estados). Normalmente, a
informação é apresentada através de uma escala de cores. No exemplo a seguir, as
vendas totais da Northwind em alguns países são apresentadas em uma escala de
gradiente azul (azul claro, menos vendas; escuro, mais vendas).

Gráfico de regiões são coloridos conforme o valor dos dados


Fonte: Indicium Academy

Se nossos dados estão associados a localizações mais genéricas, como endereços


de lojas, coordenadas geográficas etc., podemos utilizar gráficos de marcadores,
como no próximo exemplo.

Gráfico de marcadores podem combinar cores e tamanhos


Fonte: Indicium Academy

_____________________________________________________________________________________________________________________________________

Este documento é de uso exclusivo dos clientes e parceiros da Indicium Tecnologia de Dados LTDA
e não deve ser reproduzido ou compartilhado sem autorização expressa da Indicium.
18
Princípios de design para visualização de dados

Com honestidade, responda: nós, profissionais de dados, não éramos estudantes


que se destacavam pela criatividade nas aulas de arte ou de desenho na escola, não
é verdade? Ao contrário. Nossa zona de conforto sempre foram os números, o
raciocínio lógico, resolver problemas.

Por outro lado, agora, não aguentamos mais fazer o mesmo relatório em PowerPoint
com bullet-points e os mesmos gráficos de sempre. Então, resolvemos inovar, alterar
fontes, incluir cores etc. E chegamos a isso:

Uma salada mista visual


Fonte: Indicium Academy

Bagunça. Um dos maiores erros na visualização de dados é a utilização de


elementos visuais em excesso e sem coerência, aumentando o peso visual e
reduzindo o que Edward Tufte chamava de razão dado-tinta (data-ink ratio), isto é, a
proporção do espaço gráfico devotado aos dados em si.

Se remover a bagunça é a chave para aumentar a compreensão dos dados,


precisamos primeiro saber como identificar quais as escolhas que estão gerando
esse problema.

_____________________________________________________________________________________________________________________________________

Este documento é de uso exclusivo dos clientes e parceiros da Indicium Tecnologia de Dados LTDA
e não deve ser reproduzido ou compartilhado sem autorização expressa da Indicium.
19
Escolha do gráfico apropriado
Queremos comparar dados de vendas por ano que, naturalmente, cabem melhor em
gráficos de séries temporais . Nesse caso, vamos utilizar o ano como eixo X e criar
uma série para cada país. Essa simples alteração já nos permite identificar melhor
as tendências e a escala entre cada série.

Um gráfico correto facilita o entendimento


Fonte: Indicium Academy

Limpando o excesso de elementos visuais


Um erro comum nas visualizações é o excesso de elementos visuais. Muitas
ferramentas, como o Excel, já traziam gráficos visualmente pesados por padrão,
piorando a visualização de dados de forma generalizada.

Geralmente, o que queremos é o contrário: utilizar pistas visuais e otimização do


espaço vazio para priorizar os dados em relação aos demais elementos.

Na prática, há diversos princípios do design que podem auxiliar na tarefa de criar um


gráfico adequado, como as noções de proximidade, continuidade, fechamento etc.

Continuando nosso exemplo, a cor de fundo se destaca desnecessariamente e


podemos também eliminar as linhas de grade e as bordas. As legendas das séries
também não são necessárias, já que temos a mesma informação no eixo Y:

_____________________________________________________________________________________________________________________________________

Este documento é de uso exclusivo dos clientes e parceiros da Indicium Tecnologia de Dados LTDA
e não deve ser reproduzido ou compartilhado sem autorização expressa da Indicium.
20
Reduzindo a bagunça, otimizamos o entendimento
Fonte: Indicium Academy

Além do excesso, também podemos identificar a falta de consistência nos


elementos utilizados como a tipografia (fonte) e o alinhamento de texto e legenda.

Criando hierarquia
A hierarquia visual guia nossa percepção para os elementos que interessam.
Escolhas como a cor e o tamanho de fontes e outros elementos auxiliam a
identificar essas hierarquias. Por exemplo, geralmente podemos usar cores mais
claras para linhas de eixos e marcadores de dados.

_____________________________________________________________________________________________________________________________________

Este documento é de uso exclusivo dos clientes e parceiros da Indicium Tecnologia de Dados LTDA
e não deve ser reproduzido ou compartilhado sem autorização expressa da Indicium.
21
Criando hierarquias visuais
Fonte: Indicium Academy

Contando uma história

Nosso gráfico já está relativamente pronto para utilização em um dashboard


interativo, permitindo uma análise exploratória das vendas da Northwind.

Se fôssemos utilizá-lo em um relatório ou uma apresentação de análise explicativa,


poderíamos dar um passo a mais e aplicar elementos visuais para reforçar nosso
ponto.

Então, para encerrar, vamos supor que tivemos um insight de que as vendas no
Brasil cresceram entre 1997 e 1998 a um ritmo superior que dos demais países.
Assim seria o nosso gráfico:

Contando histórias visualmente


Fonte: Indicium Academy

_____________________________________________________________________________________________________________________________________

Este documento é de uso exclusivo dos clientes e parceiros da Indicium Tecnologia de Dados LTDA
e não deve ser reproduzido ou compartilhado sem autorização expressa da Indicium.
22

Você também pode gostar