Escolar Documentos
Profissional Documentos
Cultura Documentos
DE GRÁFICOS
Como escolher sempre o gráfico correto
no Excel e Power BI para qualquer cenário
PARABÉNS!
Você vai aprender a ferramenta mais desejada
pelas empresas do momento
Por outro lado, vemos que a habilidade para construção de gráficos não é tão natural assim.
Certamente não, não em muitos modelos de ensino convencionais que temos hoje. Não somos
naturalmente bons em construir visualizações. Mas a verdade é que esta habilidade está sendo
cada vez mais demandada e é preciso muito conhecimento técnico para dominar esta arte.
A análise de dados já está sendo utilizada em diversas áreas, desde setor de Recursos Humanos,
na área médica, no setor de vendas, na área de finanças, e em diversas outras.
Não existe um limite para sua aplicação, quase tudo que fazemos hoje deixa um rastro digital,
para termos uma ideia o processamento de dados dos últimos 2 anos supera todo o
processamento de dados dos últimos 3 mil anos.
Nossos dados possuem uma história, e eles não são capazes de contá-la sozinhos, saber usá-
los para interpretar cenários, tomar decisões e acompanhar métricas é cada vez mais útil e,
utilizando elementos visuais, somos capazes de contar histórias e transformar esses dados em
informações.
A visualização de dados é uma forma de arte visual que capta nosso foco, mantendo nossa
atenção na mensagem que está sendo transmitida.
70% de nossos receptores sensoriais estão em nossos olhos e ao olhar para gráficos,
rapidamente identificamos tendências, notamos padrões e exceções, internalizamos tudo isso
antes mesmo de percebemos.
Tabela vs Gráfico
Para Fernanda Viegas e Martin Wattenberg, pioneiros em análise de dados e líderes do grupo de
pesquisa de visualização de dados do Google, uma visualização ideal deve não só comunicar a
informação claramente, mas também estimular o engajamento e chamar a atenção do público.
Em uma visualização de dados efetiva, temos que tomar cuidado para não fornecemos mais
informações do que nosso cérebro consiga processar, a ideia é sempre ser claro e objetivo.
Quando vemos um visual, aquela informação é recebida inicialmente pela nossa memória
icônica e é armazenada ali por um curto período, não mais que 1 segundo. Este processo ocorre
de forma automática, processamos e armazenamos a imagem em frações de segundos, antes
mesmo de prestarmos atenção nos dados, e é conhecido como processamento pré-atentivo.
Alguns elementos pré-atentivos são cores, formas e tamanho, entender a maneira como eles
funcionam e aplicá-la corretamente é um grande diferencial na construção de visuais.
Assim como o destaque de cores, o uso de contraste, formas e posições também são recursos
que podemos utilizar para direcionar a atenção de nossa audiência, e isto é muito poderoso.
Mas lembre-se, o uso desse recurso deve ser direcionado para o nosso objetivo, quando
destacamos tudo, nada se torna importante.
A visualização de dados é uma maneira efetiva e universal de comunicar informações, ela não
se limita em deixar um gráfico bonitinho ou sobrecarregá-lo de elementos, equilibrar estética
com funcionalidade é o que vai fazer a diferença em seus gráficos, e são esses tópicos que
iremos explorar ao longo deste documento.
Esta ideia é perfeitamente aplicada quando falamos não só de dashboards, mas de visualização
de dados em geral.
Da mesma forma que no display de um carro temos as informações mais críticas para seu
funcionamento, ao demonstrar dados seguimos o mesmo conceito, dispor as informações
importantes, da melhor forma possível.
A visualização do tipo Cartão é indicada nestes casos, onde o objetivo é mostrar um valor
específico, como por exemplo, o valor total de produtos vendidos, o faturamento, ou a
quantidade de entregas em atraso.
É importante mencionar que ao utilizar o cartão simples, temos como boa prática apresentar o
valor de forma resumida, desde que não atrapalhe a compreensão do dado apresentado. Desta
forma, economizamos espaço e orientamos a atenção de nossa audiência para o que
realmente importa.
TABELAS
Certamente em algum momento você já teve contato com uma tabela, seja nos estudos,
trabalhando com planilhas, ou vendo os resultados dos jogos da copa do mundo.
Tabelas se caracterizam por dados organizados em linhas e colunas. Elas são projetadas para
organizar informações textuais e numéricas de forma clara e conveniente, permitindo uma
leitura mais rápida e são um dos instrumentos mais aplicados para análise e compreensão de
dados. Por isto, saber utilizá-las da maneira correta se torna ainda mais importante.
As tabelas interagem diretamente com nosso sistema verbal, elas são lidas por nosso cérebro.
Reforçamos que, ao optar pela utilização de uma tabela, precisamos identificar de forma clara
como a informação será consumida. Stephen Few, afirma que tabelas podem ser usadas nos
seguintes cenários:
Bordas espessas e cores em excesso acabam atrapalhando a leitura, opte sempre por manter
essas informações em segundo plano, mantendo o protagonismo no que realmente importa.
Uma grande aplicação deste tipo de visual é no cenário esportivo, onde por meio de tabelas
acompanhamos os resultados dos jogos de um campeonato, de corridas de F1, da Copa do
mundo, entre diversas outras modalidades.
Fonte: olimpiadas.globoesporte.globo.com
Vemos assim que este visual possui ampla utilização, tendo a simplicidade e a objetividade
como pontes fortes, além disso, as tabelas apresentam uma linguagem mundial que é
facilmente compreendida.
GRÁFICO DE LINHA
No gráfico de linhas, visualizamos os dados em forma de pontos, chamados de marcadores,
que são interligados por uma linha. Devido a sua estrutura, são frequentemente utilizados para
demonstrar dados contínuos, ou seja, características que podem ser descritas com números.
Ele tem grande aplicação principalmente para análises temporais, onde desejamos verificar o
comportamento de nossos dados ao longo tempo, possibilitando assim a identificação de
tendências, comportamentos atípicos, momentos de picos e de queda. Veja o exemplo abaixo:
Por exemplo, possuímos o valor total de venda de 3 filiais e desejamos verificar como este valor
se comportou nos últimos 3 anos. Abaixo temos dois exemplos:
· Em 2017 e 2018, a Loja 2 foi a loja com o maior valor de produtos vendidos;
· A loja 4 foi a única loja que apresentou uma queda no valor total vendido de 2018 para 2019.
Repare como esta análise acontece de forma muito mais intuitiva e rápida quando dispomos
estas mesmas informações no gráfico de linhas:
Além disso, conseguimos visualizar com maior clareza o comportamento individual de cada loja
e obter também um comparativo entre elas: de 2018 para 2019, por exemplo, a loja 1 ultrapassou
o valor total de venda comparado a loja 2 e se tornou a loja com o maior valor de produtos
vendidos.
Um importante ponto de atenção no gráfico de linhas são nos casos em que precisamos
demonstrar diversas variáveis. A primeira pergunta que podemos fazer é: “Todas essas
informações são realmente relevantes?”.
O gráfico acima mostra a evolução do uso dos nomes femininos de bebês mais comuns nos
Estados Unidos de 1880 a 2015.
Uma das estratégias para evitar este fenômeno é enfatizar os elementos mais importantes
através da utilização de cores mais fortes ou contrastantes, ou até mesmo a substituição de
um único gráfico por outras visualizações.
Fonte: https://www.data-to-viz.com
Um importante cuidado para termos é sempre respeitar as marcações dos eixos e isso se aplica
a qualquer tipo de gráfico.
O visual ao lado foi reproduzido pela
Fox News, para apresentar a taxa de
desemprego nos EUA de janeiro a
novembro de 2011.
Em março, a taxa de desemprego era de 8,8%, enquanto novembro apresentou uma taxa inferior,
de 8,6%. No entanto, note que graficamente, a taxa de novembro parece ser maior do que a de
março. Isto ocorre pois o número foi plotado incorretamente, levando a uma representação
gráfica errada.
Ressaltamos ainda que de janeiro a março a taxa de desemprego caiu 0,2%, uma queda menor
do que a ocorrida entre outubro e novembro, porém, observando o comportamento da curva,
temos a falsa impressão de que a queda entre janeiro e março foi maior. Abaixo, temos a correta
representação gráfica destes dados:
Isto não é uma regra, apenas uma boa prática que pode ser
aplicada para facilitar a leitura dos gráficos e evitar distrações.
Nos casos em que desejamos mostrar mais de uma série de dados dentro de cada categoria,
podemos usar o gráfico de barras agrupadas, veja abaixo:
Outra forma de visualizar este dado é através do gráfico de barras empilhadas. Ele pode ser
utilizado tanto para demonstrar valores absolutos, quanto para uma análise percentual.
Faça perguntas como “É importante para minha audiência saber o valor exato de cada variável?
Ou o intuito é ter uma ideia de proporção?”, o objetivo final e a maneira mais eficiente de
consumir esta informação serão sempre a resposta.
Neste caso, vemos que o custo da gasolina na refinaria equivale a aproximadamente 1/3 do
preço pago pelo consumidor. Os valores dos tributos federais e estaduais (CIDE, PIS/PASEP,
COFINS e ICMS) correspondem a quase metade do custo final da gasolina. A adição do etanol
anidro, obrigatória por lei, fica em 3º lugar e por último temos os custos de revenda e distribuição.
Fonte: br.com.br
Na Itália, Alemanha e Reino Unido, vemos que no período observado, mais de 50% do valor do
combustível era referente ao custo com tributos. Enquanto na Argentina, temos uma alta
margem bruta com a distribuição e revenda da gasolina. Note que o padrão de cores e a
ordenação das categorias foi fundamental para a leitura do gráfico.
Como boa prática ressaltamos a importância de sempre iniciarmos o eixo Y no zero. Nossos
olhos costumam comparar o topo das barras para comparar os valores, caso contrário,
podemos ter uma má interpretação da informação, observe abaixo:
O que aparenta ser um grande acréscimo se observado no gráfico da esquerda, traz uma outra
impressão quando dispomos a informação corretamente, mantendo as devidas proporções.
A altura da barra para janeiro de 2013 parece 5 vezes maior do que a referente ao valor atual,
mas percentualmente vemos que é uma diferença de 35% para 39,6%. Acredite, no dia a dia,
esses detalhes passam por muitas vezes desapercebidos, o desenvolvimento de nosso senso
crítico é fundamental para nos apoiar com o correto entendimento de qualquer análise.
Os gráficos de barras horizontais também podem ser usados para mostrar as partes que
compõe o valor total de uma categoria.
Por exemplo, uma rede de lojas analisa o valor vendido em um mês e deseja verificar a
representatividade deste valor por departamento, uma das formas de fazermos esta análise é
através dos gráficos de barras horizontais empilhadas.
Note que a leitura deste tipo de gráfico ocorre de maneira muito natural, e o nosso padrão de
leitura tem forte influência nisso.
Tipicamente, nossa leitura se dá da esquerda para a direita, debaixo para cima, conhecido como
“Padrão Z”, e a leitura do gráfico de barras horizontais ocorre dessa exata maneira.
O exemplo abaixo possui duas séries de dados. As barras representam o valor de venda
projetado para o mês e a linha representa o valor real vendido naquele mês. Neste exemplo,
ambas variáveis se referem ao valor de venda e foram plotadas utilizando um único eixo Y.
Uma aplicação deste gráfico é na meteorologia. O gráfico abaixo, apresentado pelo site Climate
Date, apresenta a temperatura média e o volume médio de precipitação na cidade do Rio de
Janeiro ao longo do ano.
Neste caso, precisamos adicionar um segundo eixo Y ao gráfico, assim temos um eixo Y para a
temperatura e outro para o volume de precipitação, chamamos o segundo eixo de eixo Y
secundário. O mesmo também pode ocorrer nos casos em que o tipo de dado é o mesmo, mas
apresentam grandezas diferentes.
No exemplo acima, temos a receita anual de uma loja, subdividida entre os produtos vendidos.
As barras representam o valor vendido de um determinado produto, e a linha representa a
porcentagem acumulada da frequência desta ocorrência.
Analisando o gráfico, visualizamos que a venda de TVs constituiu 44% da receita desta loja em
2019, seguido pela venda de notebooks e de refrigerador. Note que o princípio de Pareto é
claramente observado pois, em média, 80% da receita obtida foi gerada por 20% dos produtos
da loja, sendo estes TV e Notebook.
GRÁFICO DE PIZZA
Você provavelmente já viu um gráfico de pizza.
Também chamado de gráfico de setores, ele
consiste em um diagrama circular, onde cada
seção do gráfico consiste na representação
numérica da categoria.
Provavelmente você recorreu aos rótulos de dados para chegar a esta conclusão. Isto acontece
quando as seções possuem tamanhos semelhantes, se torna difícil identificar qual delas é maior.
Os gráficos de pizza em diversos casos podem não ser a melhor maneira de demonstrar seus
dados, tenha isso em mente, eles não são de fácil interpretação para o olho humano, além de
ocuparem um espaço significativo.
Em algumas ocasiões eles são aplicados para análises de “parte num todo”. Mas como
explicitado, há algumas limitações e vale a pena avaliar outras alternativas para apresentar
esta informação.
O valor intermediário pode estar relacionado à categoria tempo, por exemplo, representando
valores que entraram/saíram mês a mês; ou representando outras categorias de dados como,
por exemplo, fontes de receita ou despesa. Abaixo temos um exemplo de análise do lucro de
uma empresa a partir de sua receita em um mês.
No gráfico acima, temos como ponto de partida a receita da venda de produtos. A partir dele,
plotamos valores que representaram entrada ou saída de caixa, até chegarmos no valor final
de lucro.
Note que, no gráfico de cascatas, todos os valores intermediários são apresentados com base
no valor inicial, diferente por exemplo do gráfico de colunas, onde todos os valores são plotados
a partir da mesma referência de eixo, de forma independente.
Barra final do gráfico: A última coluna do gráfico de cascata representa o valor final da análise
que está sendo analisada. Ela sempre irá começar no mesmo eixo do valor inicial, comumente
no 0, e para destacar este valor temos como boa prática a utilização de uma cor diferente para
este dado. Uma sugestão é adotar uma cor neutra, de forma a não prejudicar a interpretação do
gráfico, utilizando também do contraste de cores para diferenciar este valor diante aos demais.
Podemos observar que o gráfico de cascata tem como grande vantagem a capacidade de
transmitir as mudanças graduais ocorridas de forma clara; por dispensar os eixos e as linhas
de grade, ele permite aos usuários focar na informação relevante e interpretá-la de forma
rápida e prática. Um outro exemplo de sua aplicação é na análise temporal, conforme abaixo.
Neste exemplo vemos a variação do fluxo de caixa mês a mês, note que no gráfico de cascata
podemos também adicionar totalizadores intermediários para enfatizarmos alguma
informação, podemos por exemplo quebrar esta análise por semestre da seguinte forma:
GRÁFICO DE DISPERSÃO
O gráfico de dispersão é uma representação gráfica utilizada para analisar a relação entre
duas ou mais variáveis quantitativas. Com ampla utilização na análise de correlação entre
duas variáveis, ele consiste em um eixo vertical (y) e um horizontal (x), onde por meio de
coordenadas cartesianas, os dados são exibidos em forma de pontos.
Desta forma, o valor de uma coordenada determina a posição do ponto no eixo X e o valor da
outra coordenada determina a posição no eixo Y, obtendo assim um ponto no gráfico.
Analisando este gráfico, podemos perceber que há uma correlação positiva entre o número de
novos clientes e o faturamento, a tendência crescente dos pontos indica que à medida que
uma variável cresce, a outra também aumenta.
Nesta análise podemos identificar que um aluno com menor número de faltas apresentou uma
nota maior, caracterizando assim uma correlação negativa.
Temos ainda a correlação nula, como podemos verificar no próximo gráfico. Vemos que há uma
grande dispersão entre os pontos, o que significa que não há uma relação aparente entre as
variáveis.
· Não existe garantia de causa-efeito. É necessário reunir outras informações para tirar melhores
conclusões.
Precisamos ter em mente que: correlação não implica causalidade. Em qualquer tipo de análise
é sempre importante utilizarmos nosso senso analítico para interpretarmos os dados que
estamos visualizando.
Assim, conseguimos ilustrar a importância do contexto que está sendo analisado, assim como
reforça a necessidade de reunirmos informações antes de concluirmos relações de causa-efeito.
Podemos, por exemplo, inferir que em dias mais quentes temos uma quantidade maior de
pessoas na praia, o que pode levar a um aumento na venda de sorvetes e no maior número de
afogamentos, pois temos mais banhistas. Mas são apenas hipóteses que precisam ser validadas
antes de chegarmos a uma conclusão final.
Dados negativos
A simples maneira de construir o gráfico pode influenciar bastante na análise, observe o exemplo:
Nos dois gráficos vemos um comparativo entre o saldo de 6 pessoas. Porém, no gráfico da
esquerda, vemos facilmente que há pessoas com saldo negativo, enquanto no gráfico da direita
esta análise não é tão favorecida. Nestes casos, priorize o valor 0 como eixo base de seus dados e
plote valores negativos abaixo e valores positivos acima.
Cuidado ao usar 3D
Podemos resumir esta boa prática em: “Evite o
uso de 3D”. Observe o gráfico ao lado e tente dizer
qual produto tem maior representatividade sobre
o valor total vendido.
Além do gráfico de pizza dificultar a análise da proporção dos números, o uso do 3D torna esta
percepção ainda mais difícil, veja que visualmente o produto B pode aparentar corresponder a
uma parte maior que o Produto A.
Em alguns casos, o uso das barras horizontais é ainda mais eficaz para demonstrar os dados,
veja os exemplos abaixo:
Porém, tenha cuidado nos casos que as categorias possuem uma ordem natural, como faixas
etárias (0 – 10 anos; 11 – 20 anos...), nesses casos vale a pena manter o gráfico numa ordem
lógica. A dica é manter os dados numa ordem que faça sentido, sempre tendo em mente o
modo como a audiência irá consumir a informação.
Imagine analisar gráficos semelhantes a esse várias vezes durante o dia, ou até ter diversos
gráficos dispostos numa mesma página, o uso excessivo de cores acaba atrapalhando e
fazendo com que tenhamos mais esforço para interpretarmos os dados.
Além disso, outra dica é evitar o uso de vermelho e verde juntos, parte da população possui
daltonismo, o que dificulta a distinção desses dois tons. É fato que verde e vermelho são cores
com diversas aplicações e podem ser empregadas de maneira muito eficiente, já que o
vermelho é constante associado a perigo e o verde a valores que indicam crescimento, lucro.
Tenha apenas em mente que acrescentar outros parâmetros como rótulo de dados, marcação
de eixos, ou alguma escrita são um ótimo recurso para auxiliar na interpretação desses dados,
garantindo que todos possam ter uma leitura completa da análise.
Nos casos em que o foco é analisar tendências, por exemplo, a utilização de rótulo de dados
pode não ser tão útil, nesses casos a apresentação dos eixos pode auxiliar mais na análise,
podemos mantê-los e deixar sua cor mais sutil, de modo que não chame muita atenção.
Nas análises onde o valor específico de uma variável é importante, o uso dos rótulos de dados é
recomendado.
De modo geral, sempre considere
como os dados serão interpretados
e qual a informação que se deseja
passar, dessa forma, construímos o
gráfico da maneira mais eficiente.