Escolar Documentos
Profissional Documentos
Cultura Documentos
Visualizando dados
Quem?
Essa tarefa é normalmente realizada pela equipe de
analistas de dados e data scientists
Há outra forma de geração de valor com base em dados, que são as decisões
tornadas possíveis por algoritmos de inteligência artificial, que podem ter um
caráter mais operacional, como um modelo de previsão de fraude, ou ter uma
função mais tática e estratégica, como os modelos de previsão de vendas, por
exemplo.
Aqui, vamos discutir técnicas e ferramentas que auxiliam no primeiro caso, isto é, na
tomada de decisão e geração de valor a partir da exploração visual dos dados no
dia a dia das empresas.
_____________________________________________________________________________________________________________________________________
Este documento é de uso exclusivo dos clientes e parceiros da Indicium Tecnologia de Dados LTDA
e não deve ser reproduzido ou compartilhado sem autorização expressa da Indicium.
1
No mínimo, fatores como contexto, audiência e objetivos devem ser priorizados
antes da criação da visualização em si. E, para se tornar um especialista em
visualização de dados, é preciso saber contar histórias a partir deles.
Sem ter um caminho claro, podemos seguir pelas nebulosas visualizações que mais
atrapalham do que ajudam, como os gráficos em 3D, os gráficos de pizza sem
qualquer significado, as cores que confundem etc. (KNAFLIC, 2015).
_____________________________________________________________________________________________________________________________________
Este documento é de uso exclusivo dos clientes e parceiros da Indicium Tecnologia de Dados LTDA
e não deve ser reproduzido ou compartilhado sem autorização expressa da Indicium.
2
Em resumo, vamos dividir este tema em cada umas das etapas do processo de
visualização de dados:
Definindo o contexto
_____________________________________________________________________________________________________________________________________
Este documento é de uso exclusivo dos clientes e parceiros da Indicium Tecnologia de Dados LTDA
e não deve ser reproduzido ou compartilhado sem autorização expressa da Indicium.
3
relacionada a um ou mais problemas de algum processo de negócios, como vendas,
recursos humanos, financeiro, suporte etc.
Por exemplo, vamos supor que nós fomos contratados pelo gerente de vendas da
Northwind, e que ele quer melhorar o desempenho das vendas nas diferentes
divisões de negócio. Para esse problema, podemos elaborar diferentes perguntas
que podem nos ajudar na tomada de decisão:
É possível ainda que ambos sejam necessários: podemos ter que gerar um relatório
mensal explicando tendências e oportunidades e, ao mesmo tempo, criar um
dashboard atualizado diariamente para acompanhamento de metas e indicadores.
O importante é que fique clara para você a diferença entre ambos, que vai impactar
no meio, visuais, filtros etc. que iremos utilizar.
_____________________________________________________________________________________________________________________________________
Este documento é de uso exclusivo dos clientes e parceiros da Indicium Tecnologia de Dados LTDA
e não deve ser reproduzido ou compartilhado sem autorização expressa da Indicium.
4
Como veremos futuramente, o bom uso do espaço vazio, de elementos gráficos,
hierarquias, fontes etc. é essencial para que uma visualização tanto seja agradável
quanto passe a informação de forma eficiente.
Escolhendo o formato
A escolha entre um desses dois parte principalmente do tipo de análise: para fins de
análise exploratória, as ferramentas de BI, ou mesmo planilhas bem elaboradas,
permitem visualizar grandes volumes de dados com grande flexibilidade, alterando
filtros e agrupamentos para gerar insights rapidamente. Por outro lado, quando
queremos explicar tendências ou análises, o ideal é utilizar relatórios em que a
história é contada de uma forma bem desenhada e com filtros e agrupamentos bem
definidos.
_____________________________________________________________________________________________________________________________________
Este documento é de uso exclusivo dos clientes e parceiros da Indicium Tecnologia de Dados LTDA
e não deve ser reproduzido ou compartilhado sem autorização expressa da Indicium.
5
Outros pontos importantes na hora de estruturar a formatação é levar em conta os
objetivos e a audiência. Indicadores estratégicos, em geral, cabem melhor em
relatórios ou dashboards mais resumidos. Já quando o objetivo é visualizar
indicadores operacionais, pode ser necessário incluir gráficos mais detalhados e em
maior quantidade.
No nosso projeto da Northwind, uma boa ideia pode ser um dashboard para
visualizar as principais métricas da área comercial da empresa. Assim, podemos
explorar os diferentes agrupamentos e filtros para responder as perguntas de nosso
gestor.
Nesse momento, ainda não sabemos qual ferramenta utilizar, mas já podemos
seguir um padrão do geral para o específico:
_____________________________________________________________________________________________________________________________________
Este documento é de uso exclusivo dos clientes e parceiros da Indicium Tecnologia de Dados LTDA
e não deve ser reproduzido ou compartilhado sem autorização expressa da Indicium.
6
Para facilitar, podemos fazer um desenho simplificado do layout do dashboard com
perguntas que queremos responder:
_____________________________________________________________________________________________________________________________________
Este documento é de uso exclusivo dos clientes e parceiros da Indicium Tecnologia de Dados LTDA
e não deve ser reproduzido ou compartilhado sem autorização expressa da Indicium.
7
Utilizando elementos gráficos
A concretização da visualização é uma apresentação visual de dados e informações
utilizando elementos gráficos. Contrário ao que muitos podem pensar, esses
elementos não se resumem ao que chamamos geralmente apenas de gráficos, pois
também incluem outros elementos visuais, como textos, tabelas, diagramas etc.
Aqui vale mais uma vez reforçar: o objetivo da visualização de dados é permitir e
facilitar a tomada de decisão a partir dos dados. Para isso, devemos utilizar as
ferramentas, os gráficos e as técnicas de design adequadas a fim de facilitar e
realçar as informações mais relevantes dentro do contexto a que nos propusemos
essa tarefa.
_____________________________________________________________________________________________________________________________________
Este documento é de uso exclusivo dos clientes e parceiros da Indicium Tecnologia de Dados LTDA
e não deve ser reproduzido ou compartilhado sem autorização expressa da Indicium.
8
caráter puramente estético, mas que não sirvam para o objetivo. Ou seja, há um
motivo para que tabelas e gráficos de barras sejam tão utilizados, e não devemos ter
medo de usá-los.
Isso não quer dizer que não devemos buscar a beleza em nossos visuais, muito pelo
contrário. Está comprovado que gráficos esteticamente bonitos facilitam a
compreensão e aumentam o engajamento da audiência. Em seu clássico livro Visual
display of quantitative information, Edward Tufte argumenta que o gráficos devem:
- mostrar os dados;
- induzir o leitor a pensar sobre a substância, não sobre a metodologia, o
design, técnica gráfica etc.;
- evitar distorcer o que os dados querem dizer;
- tornar grandes bases de dados coerentes;
- revelar os dados em diferentes níveis de detalhe, desde uma visão geral até
detalhes finos;
- ter um propósito claro: descrição, exploração, tabulação ou decoração;
- ser intimamente integrado com a descrição verbal e estatística dos dados.
Exemplos de Gráficos
Fonte: Indicium Academy
_____________________________________________________________________________________________________________________________________
Este documento é de uso exclusivo dos clientes e parceiros da Indicium Tecnologia de Dados LTDA
e não deve ser reproduzido ou compartilhado sem autorização expressa da Indicium.
9
Gráficos de linhas
Os gráficos de linhas são uma das formas mais antigas de se visualizar dados,
como este:
_____________________________________________________________________________________________________________________________________
Este documento é de uso exclusivo dos clientes e parceiros da Indicium Tecnologia de Dados LTDA
e não deve ser reproduzido ou compartilhado sem autorização expressa da Indicium.
10
Um erro comum em gráficos de linhas é tentar incluir séries demasiadamente,
criando o que chamamos de gráfico espaguete. O resultado é uma visualização de
dados pouco informativa e de pouca ou nenhuma utilidade.
Entre as opções para evitar esse problema, podemos realçar uma ou mais séries de
interesse e esconder as demais com uma cor de menor hierarquia (cinza, por
exemplo).
_____________________________________________________________________________________________________________________________________
Este documento é de uso exclusivo dos clientes e parceiros da Indicium Tecnologia de Dados LTDA
e não deve ser reproduzido ou compartilhado sem autorização expressa da Indicium.
11
Realçar a série de interesse quando há muitas séries de dados
Fonte: Indicium Academy
Gráficos de barras
Outro muito utilizado é o gráfico de barras, que pode ser horizontal, vertical,
empilhado etc. E não é por acaso, pois esse tipo de visualização é muito intuitivo
para comparações entre um número pequeno de categorias.
É um gráfico que traz a noção de escala nas diferenças que não conseguimos obter
por meio de tabelas.
_____________________________________________________________________________________________________________________________________
Este documento é de uso exclusivo dos clientes e parceiros da Indicium Tecnologia de Dados LTDA
e não deve ser reproduzido ou compartilhado sem autorização expressa da Indicium.
12
Gráficos de colunas
Os gráficos de barras verticais ou de colunas são provavelmente a versão mais
utilizada para comparativos entre categorias. No entanto, a facilidade em comparar
rapidamente as barras nos gráficos pode causar problemas caso a escala do eixo y
não seja o padrão iniciado em 0, já que, em muitos casos, o leitor assumirá esse
entendimento sem ler com calma os valores da escala.
_____________________________________________________________________________________________________________________________________
Este documento é de uso exclusivo dos clientes e parceiros da Indicium Tecnologia de Dados LTDA
e não deve ser reproduzido ou compartilhado sem autorização expressa da Indicium.
13
Exemplo de gráfico de barras horizontais
Fonte: Indicium Academy
Quando colocamos lado a lado um gráfico de barras e um de pizza, fica ainda mais
claro por que a escolha pelo primeiro. Comparando-se grandezas parecidas, é
visualmente difícil identificar padrões nos gráficos de pizza. Se essas grandezas
forem distintas o suficiente, o gráfico de barras funcionará ainda melhor que o de
pizza:
_____________________________________________________________________________________________________________________________________
Este documento é de uso exclusivo dos clientes e parceiros da Indicium Tecnologia de Dados LTDA
e não deve ser reproduzido ou compartilhado sem autorização expressa da Indicium.
14
Gráficos de dispersão
Para visualizar a relação entre duas variáveis numéricas, como para identificar
tendências, o gráfico de dispersão (ou scatterplot) é um dos mais adequados.
Gráfico de dispersão
Fonte: Indicium Academy
Tabelas
Não raramente o que parece ser mais simples seja também o mais adequado. As
tabelas são muito importantes na visualização de dados e não é porque são comuns
que devem ser menosprezadas.
Utilizar gráficos para apresentar grandezas que não são comparáveis entre si é um
mau uso de técnicas de visualização. Nesse caso, fique com as tabelas.
_____________________________________________________________________________________________________________________________________
Este documento é de uso exclusivo dos clientes e parceiros da Indicium Tecnologia de Dados LTDA
e não deve ser reproduzido ou compartilhado sem autorização expressa da Indicium.
15
Em alguns casos, utilizar gráficos prejudica o entendimento
Fonte: Indicium Academy
Assim como um bom design de livro ou artigo é pensado para que se foque na
história, uma tabela bem feita ressalta os dados que ela contém, não suas bordas,
cores etc.
Falando em cores, elas são uma opção um pouco mais visual na categoria das
tabelas para realçar padrões nos dados no chamado mapa de calor (heatmap). Esse
tipo de elemento gráfico é interessante para tabelas com muitas categorias e
métricas distintas e que queremos identificar outliers rapidamente.
_____________________________________________________________________________________________________________________________________
Este documento é de uso exclusivo dos clientes e parceiros da Indicium Tecnologia de Dados LTDA
e não deve ser reproduzido ou compartilhado sem autorização expressa da Indicium.
16
Mapas de calor podem realçar outliers
Fonte: Indicium Academy
Textos
Quando queremos realçar um número específico ou indicadores que resumem muita
informação em si mesmos (como totais, médias etc.), o uso de textos pode ser o
mais adequado.
Desenvolvendo um painel de BI, por exemplo, é comum utilizar visuais de texto
(scorecards) na área superior dele para facilitar a visualização rápida dos
indicadores mais importantes.
Os elementos textuais podem incluir também informações sobre variações
comparativas, facilitando o entendimento sem a necessidade de utilização de um
gráfico.
Exemplos de Scorecards
Fonte: Indicium Academy
Mapas
Os mapas são elementos naturalmente adequados para visualização de dados com
dimensões geográficas. O uso desses elementos hoje é possível na grande maioria
das ferramentas de visualização sem necessidade de processamentos adicionais.
_____________________________________________________________________________________________________________________________________
Este documento é de uso exclusivo dos clientes e parceiros da Indicium Tecnologia de Dados LTDA
e não deve ser reproduzido ou compartilhado sem autorização expressa da Indicium.
17
Mapas regionais são ideais quando os dados que queremos visualizar fazem
sentido em regiões bem definidas (como cidades, países, estados). Normalmente, a
informação é apresentada através de uma escala de cores. No exemplo a seguir, as
vendas totais da Northwind em alguns países são apresentadas em uma escala de
gradiente azul (azul claro, menos vendas; escuro, mais vendas).
_____________________________________________________________________________________________________________________________________
Este documento é de uso exclusivo dos clientes e parceiros da Indicium Tecnologia de Dados LTDA
e não deve ser reproduzido ou compartilhado sem autorização expressa da Indicium.
18
Princípios de design para visualização de dados
Por outro lado, agora, não aguentamos mais fazer o mesmo relatório em PowerPoint
com bullet-points e os mesmos gráficos de sempre. Então, resolvemos inovar, alterar
fontes, incluir cores etc. E chegamos a isso:
_____________________________________________________________________________________________________________________________________
Este documento é de uso exclusivo dos clientes e parceiros da Indicium Tecnologia de Dados LTDA
e não deve ser reproduzido ou compartilhado sem autorização expressa da Indicium.
19
Escolha do gráfico apropriado
Queremos comparar dados de vendas por ano que, naturalmente, cabem melhor em
gráficos de séries temporais . Nesse caso, vamos utilizar o ano como eixo X e criar
uma série para cada país. Essa simples alteração já nos permite identificar melhor
as tendências e a escala entre cada série.
_____________________________________________________________________________________________________________________________________
Este documento é de uso exclusivo dos clientes e parceiros da Indicium Tecnologia de Dados LTDA
e não deve ser reproduzido ou compartilhado sem autorização expressa da Indicium.
20
Reduzindo a bagunça, otimizamos o entendimento
Fonte: Indicium Academy
Criando hierarquia
A hierarquia visual guia nossa percepção para os elementos que interessam.
Escolhas como a cor e o tamanho de fontes e outros elementos auxiliam a
identificar essas hierarquias. Por exemplo, geralmente podemos usar cores mais
claras para linhas de eixos e marcadores de dados.
_____________________________________________________________________________________________________________________________________
Este documento é de uso exclusivo dos clientes e parceiros da Indicium Tecnologia de Dados LTDA
e não deve ser reproduzido ou compartilhado sem autorização expressa da Indicium.
21
Criando hierarquias visuais
Fonte: Indicium Academy
Então, para encerrar, vamos supor que tivemos um insight de que as vendas no
Brasil cresceram entre 1997 e 1998 a um ritmo superior que dos demais países.
Assim seria o nosso gráfico:
_____________________________________________________________________________________________________________________________________
Este documento é de uso exclusivo dos clientes e parceiros da Indicium Tecnologia de Dados LTDA
e não deve ser reproduzido ou compartilhado sem autorização expressa da Indicium.
22