Você está na página 1de 40

Fundamentos

de Data
Visualization
com Mariana Kobayashi
Sumário
Módulo 1............................................................................................................................................................ 5
Lição 1: Objetivos do módulo......................................................................................................................... 6
Lição 2: Por que devemos estudar sobre o Data Visualization? .................................................................. 6
Uma perspectiva dos analistas .................................................................................................................. 6
Os dados são usados para tudo ................................................................................................................ 6
Por que usar a visualização de dados ....................................................................................................... 7
Lição 3: Quais os benefícios de uma boa visualização de dados? .............................................................. 8
O que é o Data Visualization? .................................................................................................................... 8
Os principais benefícios ............................................................................................................................. 8
Exemplo de Data Visualization................................................................................................................... 8
Lição 4: Relação de Data Visualization com a cultura Data Driven.............................................................. 9
O que é a cultura Data Driven? .................................................................................................................. 9
As diferenças entre orientar e informar dados ........................................................................................... 9
As etapas para alcançar o Data Driven ................................................................................................... 10
Sua relação com o Data Visualization ..................................................................................................... 10
Lição 5: A percepção visual na visualização de dados ............................................................................... 11
Os fluxos de informações em larga escala .............................................................................................. 11
Como promover o estímulo visual?.......................................................................................................... 11
O princípio da Proximidade ...................................................................................................................... 12
O princípio da Similaridade ...................................................................................................................... 12
O princípio do Acercamento ..................................................................................................................... 13
O princípio do Fechamento ...................................................................................................................... 13
O princípio da Continuidade ..................................................................................................................... 14
O princípio da Conexão ............................................................................................................................ 14
Lição 6: As classificações de análise de dados .......................................................................................... 16
A Análise Descritiva .................................................................................................................................. 16
A Análise Diagnóstico............................................................................................................................... 16
A Análise Preditiva.................................................................................................................................... 17
A Análise Prescritiva................................................................................................................................. 17
Lição 7: As melhores ferramentas de apresentações de dados................................................................. 18
Ciclo de Trabalho pelas Ferramentas de BI ............................................................................................ 18
Lição 8: Quais os processos para uma boa atividade analítica?................................................................ 19
Lição 9: A Integração e a Qualidade dos dados ......................................................................................... 19
A Integração de dados na área industrial ................................................................................................ 21
Módulo 2.......................................................................................................................................................... 22
Lição 1: Objetivos do módulo....................................................................................................................... 23
Lição 2: A importância da identidade visual para dados ............................................................................. 23
O público como elemento principal .......................................................................................................... 23
Lição 3: A organização de tabelas para visualização ................................................................................. 24
Texto Simples ........................................................................................................................................... 24
Tabelas ..................................................................................................................................................... 25
Mapas de Calor ........................................................................................................................................ 25
Lição 4: Como apresentar gráficos com qualidade ..................................................................................... 26
Gráfico de Pontos ..................................................................................................................................... 26
Gráfico de linhas ....................................................................................................................................... 26
Gráfico de barras ...................................................................................................................................... 27
Gráfico de áreas ....................................................................................................................................... 28
Lição 5: Como mostrar dados certos para pessoas certas......................................................................... 29
Lição 6: Como contar histórias com dados? ............................................................................................... 30
Lição 7: Os vieses cognitivos na análise de dados..................................................................................... 31
Viés de Percepção.................................................................................................................................... 31
Viés de Seleção ........................................................................................................................................ 31
Efeito de Auréola ...................................................................................................................................... 32
Cuidados com o viés na análise de dados .............................................................................................. 32
Lição 8: As programações e o ETL ............................................................................................................. 33
Lição 9: A visualização de dados em Python e R ....................................................................................... 34
Matplotlib................................................................................................................................................... 34
Seaborn..................................................................................................................................................... 35
Geoplotlib .................................................................................................................................................. 35
Lição 10: Aprendendo com exemplos práticos ........................................................................................... 35
Lição 11: A relação do Design Thinking para visualização de dados......................................................... 36
O Funil do Conhecimento ......................................................................................................................... 37
Visual Thinking ......................................................................................................................................... 37
Design Thinking e inovação ..................................................................................................................... 37
Lição 12: A visualização de dados para resultados e análises................................................................... 39
Referências .................................................................................................................................................. 40
Direitos desta edição reservados
A Voitto Treinamento e Desenvolvimento
www.voitto.com.br

Supervisão editorial: Thiago Coutinho de Oliveira

Apresentação do curso: Mariana Kobayashi

Produção de conteúdo: Diego Henrique Nobre Costa

Mariana Kobayashi é formada em engenharia química pela Escola Politécnica de São Paulo.
Mestre em Energia e Processos de Refino pelo Instituto Francês do Petróleo, trabalha como
Coordenadora de projetos de transformação digital, contribuindo para projetos como "Refinaria 4.0",
atuando também como Facilitadora de Transformação Digital, ajudando a possibilitar a integração
de dados, análise de dados, projetos de BI e implementação de modelos de aprendizagem de
máquinas no ramo de refino e petroquímica. Co-founder de duas start-ups, uma na área de green
hydrogen e outra em consultoria em transformação digital e dados. É professora de transformação
digital e análise de dados no Instituto Francês do Petróleo e ENSGTI, ambos na França.

É PROIBIDA A REPRODUÇÃO

Nenhuma parte desta obra poderá ser reproduzida, copiada, transcrita ou mesmo transmitida
por meios eletrônicos ou gravações sem a permissão, por escrito, do editor. Os infratores
serão punidos pela Lei n° 9.610/98
Módulo 1
Compreendendo o Data Visualization
Lição 1: Objetivos do módulo
Nesse módulo você vai aprender quais são os fundamentos do Data Visualization, qual sua
importância dentro do processo analítico de dados e seus benefícios. Além de explicações teóricas
e aplicações práticas da implementação de elementos visuais e exemplos atuais.

Responderemos perguntas do tipo:


✓ O que é Data Visualization?
✓ Que elementos compõem a visualização de dados?
✓ Quais os benefícios desta prática?

Lição 2: Por que devemos estudar sobre o Data Visualization?

Uma perspectiva dos analistas


De acordo com o analista de dados Simon Samuel,

“A visualização de dados mudará a maneira como nossos analistas trabalham com os


dados. Espera-se que eles respondam aos problemas mais rapidamente e que busquem
por mais insights – que olhem para os dados de maneira diferente, com mais
imaginação.”

Assim, a visualização de dados busca promover uma exploração de informações e dados


complexos de maneira criativa para total compreensão e compartilhamento do conhecimento.
Dentro desse contexto, segundo o Infomoney, em 2022 a profissão de Cientista de Dados
ganhou grandes destaques no setor de tecnologia, devido às transformações digitais e com uma
perspectiva de salário mensal de R$ 13 mil a R$ 21 mil para júnior-sênior. A profissão atrelada
aos conceitos de Data Visualization auxilia os tomadores de decisões a identificarem novos
padrões e apresentarem seus resultados por meio de análises visuais.

Os dados são usados para tudo


Os dados possuem diversas funcionalidades, podendo destacar entre elas:

Definir e melhorar o posicionamento ou preço dos produtos;

Definir prioridades, objetivos e direções no nível mais amplo;


Explorar métricas de desempenho, pesquisa de mercado e benchmarking;

Melhorar os serviços, produtos e a experiência de usuário;

Aumentar os leads, vendas e lucros;

Melhorar a experiência e integridade dos trabalhadores;

Por que usar a visualização de dados


Independente da área atuante de qualquer negócio, há a necessidade de visualizar dados
para melhor compreensão do cenário atual da empresa, enxergando grandes volumes de
informações de forma concisa, rápida e resolvendo problemas. Citamos aqui alguns fatores
importantes da sua importância nas organizações:

1. Usar uma forma mais eficiente de transmitir e assimilar informações: Normalmente,


as informações de negócios compiladas por equipes de gerenciamento incluem tabelas e gráficos
estatísticos desagradáveis. As empresas que usam a visualização de dados têm maior
probabilidade de encontrar novas maneiras de interpretar dados, além disso encontram as
informações que precisam com maior facilidade e são mais produtivos.

2. Identificar as ligações e tendências entre as diferentes atividades de negócios: Ao


facilitar as correlações, a visualização de dados permite que os gerentes identifiquem e resolver as
fontes de problemas mais rapidamente. Os dados também podem ser comparados de forma ágil e
fácil.

3. Lidar com tendências de mercado rapidamente: Diversas oportunidades podem ser


descobertas interpretando os fragmentos de informações. Ser capaz de reunir esses dados é uma
vantagem competitiva, pois permite que as organizações capturem as mudanças no mercado e no
comportamento do consumidor.

4. Permitir interação direta com os dados: As ferramentas de visualização de dados


permitem não apenas ver os dados, mas também manipular e interagir com eles. As ações mais
eficazes podem, portanto, ser propostas com base nos modelos analíticos desenvolvidos por meio
de visualização em tempo real e análise preditiva.

5. Contar histórias convincentes: Envolver as equipes de gerenciamento em seus dados


se traduz em maior desempenho. A maneira como os funcionários enxergam as informações está
mudando com a capacidade da visualização de dados.

Lição 3: Quais os benefícios de uma boa visualização de dados?

O que é o Data Visualization?


Se trata de uma prática utilizada para representar elementos visuais de dados ou
informações complexas, por meio de diversos tipos de gráficos, tabelas, diagramas e fluxos,
possibilitando a capacidade de ampliar a cognição.
Uma boa visualização de dados pode proporcionar insights importantes, a partir de um
conjunto de informações que estão relacionadas entre si. Por meio desta análise visual torna-se
mais fácil identificar padrões, comparações e detalhamentos de dados.

Os principais benefícios
1. Compartilhável
Facilitam os processos de aprendizagem e gestão do conhecimento para uma melhor
compreensão dos dados em um grupo.

2. Tomada de Decisões
Garantem confiança e tomadas de decisões ágeis de decisões fundamentos nos dados
disponíveis, obtendo insight mais claros e precisos.

3. Alto Impacto
Por meio de tabelas, gráficos e dashboards, esses elementos visuais tornam a apresentação
de dados mais dinâmica e eficaz.

Exemplo de Data Visualization


Um dos maiores exemplos de visualização de dados é o Google Analytics, o qual tem como
objetivo criar novos mecanismos de detecção de informação, buscando novos tratamentos desses
dados para melhor entendimento e métricas sofisticadas de visualização de sites. Assim, a
ferramenta permite garantir um bom gerenciamento de sites através da coleta de dados.
Com a intensa digitalização das mais diversas atividades, a ferramenta possui alguns
recursos que auxiliam diversos processos importantes, capaz de fornecer ao usuário o
entendimento dos dados e propor formas de otimização. Dentre esses recursos, destacam-se
os relatórios em tempo real, coleta de inúmeras informações sobre o público e consulta de maneira
segmentada o comportamento do usuário durante a navegação do site. Tudo isso de maneira
prática e de fácil percepção visual.

Lição 4: Relação de Data Visualization com a cultura Data Driven

O que é a cultura Data Driven?


Para que os fundamentos de Data Visualization sejam praticados, é necessário
reconhecermos a cultura Data Driven e seus processos. Ela se trata de uma cultura orientada
a dados, a qual busca tornar as tomadas de decisões mais adequadas possíveis, de acordo com
o máximo potencial de dados existentes.
De maneira geral, é importante seguir 3 passos fundamentais para sua integração:

1 2 3
Utilização de dados para Validação dos Execução de acordo com
orientar a decisão planos de ação os objetivos estabelecidos

As diferenças entre orientar e informar dados


Dentro da cultura organizacional para empresas que lidam com grande base de dados, é
importante entender as diferenças de orientar e informar os dados para seus membros.
As etapas para alcançar o Data Driven
Diante dos conceitos de dados apresentados, é necessário agora buscar alcançar o caminho
da cultura Data Driven em sua organização. Para isso, essa trilha passa pelas seguintes etapas de
tratamento de dados e informações:

1. Data Aware: Dados são compilados manualmente;


2. Data Proeficient: Realizar relatórios personalizados;
3. Data Safety: Usar dados para justificar decisões;
4. Data Savvy: Usar dados para decisões críticas;
5. Data Driven: Usar dados para todas as decisões.

Sua relação com o Data Visualization


Assim dentro dos conceitos de Data Driven, da intensidade dos fluxos de informações e
de dados mais dinâmicos, o Data Visualization contribui para auxiliar em ferramentas úteis para
a empresa, de modo que possam abordar com grande potencial os seguintes segmentos:

1. Relatórios Dinâmicos: Trabalhando a análise de resultados e dados por meio de


relatórios autoexplicativos, de modo que tragam mais clareza aos grupos
envolvidos.

2. Monitoramento de Metas: Os planos de execuções podem ser monitorados e os


resultados consultados, por meio de uma rápida visualização, identificando pontos
de melhorias.

3. Segurança na Tomada de Decisão: As ferramentas e a manipulação assertiva


desses dados proporcionam maior segurança e precisão na previsão de novos
cenários.
Lição 5: A percepção visual na visualização de dados

Os fluxos de informações em larga escala


O excesso de dados da atual era da informação muitas vezes pode não proporcionar novos
conhecimentos, devido às dificuldades de organizar conexões e de construir representações
visuais adequadas dos dados.
Para isso, é necessário entender como funciona a base de todo aprendizado, respeitando
suas etapas e seus pilares para o conhecimento:

Dados Conhecimento Aplicação

Informação

Os dados são a matéria-prima da informação, que ainda não recebeu um tratamento


adequado. Esses dados representam um significado que isoladamente não têm uma capacidade
de transmitir uma mensagem ou representar um conhecimento.
As informações são os dados tratados. Esse processo busca trazer significado às
informações, realizando tomadas de decisões ou fazendo afirmações baseadas em dados. Ou seja,
é um conjunto de dados, que após algum tratamento, seja manual, mecânico ou eletrônico,
produziu um resultado com significado.
Já o conhecimento vai além da informação, produz ideias ou experiências que as
informações por si só não serão capazes de mostrar. Conhecimento é a informação trabalhada.

Como promover o estímulo visual?

É importante conhecer as diversas maneiras de representação visual para que


seu público consiga ler de maneira fácil, adicionando valores informativos suficientes.

Sendo assim, há alguns princípios da percepção visual capazes de proporcionar esses


valores, teorizados pela Escola de Psicologia Gestalt:
O princípio da Proximidade
Este princípio busca entender como podemos identificar e observar padrões diferentes, por
meio da proximidade relativa entre os grupos. No exemplo abaixo, é possível observar os pontos
como três pontos distintos, devido à proximidade relativa entre os grupos.

Agrupamentos

Além disso, podemos diferenciá-los por meio de espaçamentos entre os pontos. Seus olhos
podem ser atraídos pelas colunas ou pelas linhas, como nos exemplos a seguir:

Colunas Linhas

O princípio da Similaridade
Naturalmente, você pode associar os elementos como cor, formas, tamanhos e orientações
semelhantes que podem ser notados quando pertencem a um mesmo grupo ou segmento. Esse
princípio ajuda a chamar a atenção do público para onde desejamos focar e esse tipo de recurso
pode ser aproveitado em tabelas.

Círculos à esquerda e quadrados à direita


O princípio do Acercamento
Trabalha com a delimitação de elementos que podem fazer parte de um grupo. O uso de
sombreados de fundo claro já é suficiente para dar um destaque adequado.

Delimitações por linhas e sombras

Além disso, outro modo de aproveitar este princípio é traçar uma distinção visual de nossos
dados. Isso pode ser realizado por meio de áreas sombreadas também.

Áreas sombreada separando a previsão dos dados reais

O princípio do Fechamento
Para tornar a visualização mais simples e intuitivas em nossas mentes, tendemos a
perceber um conjunto de elementos individuais como uma única forma reconhecível. É comum os
aplicativos de geração de gráficos terem um padrão de elementos como bordas e sombreados de
fundo. Mas, de acordo com o princípio do fechamento, muitas vezes tornam-se desnecessários e
ao retirá-los damos maior destaque aos nossos dados.

Excessos de elementos poluem a visão


O princípio da Continuidade
Semelhante ao princípio do fechamento, o da continuidade procura busca criar caminhos
mais suaves e de progressão do que é visto naturalmente. Podemos pegar elementos e separá-
los, mostrando o que se esperar ver em seguida, como na representação abaixo:

Separação de objetos

Também é possível observar em gráficos. Na demonstração a seguir, ao remover a linha


vertical do eixo y, nossos olhos ainda percebem que as barras continuam alinhadas no mesmo
ponto, graças ao espaçamento uniforme entre elas, as legendas à esquerda e os dados
informativos à direita. Essa remoção permite que os dados ganhem maior destaque.

Gráf ico sem o eixo Y

O princípio da Conexão
Normalmente, a propriedade conectiva tem valor associativo mais forte em relação a cores,
tamanhos ou formas similares. No exemplo a seguir, nossos olhos tendem a montar pares das
formas conectadas por linhas. O princípio da conexão não é mais forte que o acercamento, mas
pode afetar essa relação, por meio de espessuras ou tonalidades, criando hierarquias visuais.
Pares de f ormas com linhas

Já em gráficos, um uso frequentes deste princípio pode ser observado nos gráficos de
linhas, para ajudar nossos olhos a ver uma relação de ordem nos dados.

Linhas conectando pontos


Lição 6: As classificações de análise de dados
Para uma apresentação de qualidade é necessário reconhecer quais tipos de dados estão
sendo utilizados em seus estudos. Essa classificação é determinada dependendo do seu grau de
valor e complexidade dos dados em tratamento:

A Análise Descritiva

Análise
Prescritiva
Valor

Análise
Preditiva

Análise
Diagnóstico

Análise
Descritiva

Complexidade

Utiliza dados históricos e atuais de várias fontes para descrever o estado atual,
identificando tendências e padrões. Em análise de negócios, esse é o escopo da inteligência de
negócios (BI).

A Análise Diagnóstico

Análise
Prescritiva
Valor

Análise
Preditiva
Análise
Diagnóstico

Análise
Descritiva

Complexidade
Geralmente, utilizam-se dados gerados pela análise descritiva para descobrir fatores ou
razões de desempenhos anteriores.

A Análise Preditiva

Análise
Prescritiva
Valor

Análise
Preditiva
Análise
Diagnóstico

Análise
Descritiva

Complexidade

Aplica técnicas de modelagens estatísticas e ao aprendizado de máquina, a partir das


análises descritivas e diagnósticas, para fazer previsões sobre resultados futuros.

A Análise Prescritiva

Análise
Prescritiva
Valor

Análise
Preditiva
Análise
Diagnóstico

Análise
Descritiva

Complexidade

Envolve a aplicação de testes e outras técnicas, como aprendizado de máquina, regras de


negócios e algoritmos, para recomendações de novas soluções.
Lição 7: As melhores ferramentas de apresentações de dados

O termo Business Inteligence (BI) refere-se às tecnologias, ferramentas, aplicativos e


práticas de coletas para integração e apresentação de informações, oferecendo suporte aos
negócios desde os pontos operacionais até aos estratégicos. O objetivo do Business Intelligence é
apoiar a melhor tomada de decisões de negócios. Mas, para isso, o profissional utiliza de algumas
ferramentas importantes para dar suporte e fornecer visões históricas, atuais e preditivas,
combinando diversas fontes de dados.

Assim, podemos destacar como principais ferramentas o Power BI e o Excel. Vejamos


algumas aplicações de suas funcionalidades:

➢ Ferramentas como Power BI e Excel são as mais comuns entre as empresas, por
meio do uso de dashboards;

➢ Facilitam a combinação de dados dentro e fora da empresa;

➢ Colaboram para o compartilhamento e democratização dos dados entre os


membros.

Ciclo de Trabalho pelas Ferramentas de BI


As ferramentas de BI são um conjunto de serviços de software, aplicativos e conectores, os
quais trabalham juntos para transformar diferentes fontes de dados em informações visuais
imersivas e interativas. Sendo assim, podemos destacar como vantagem a consolidação de
várias fontes de dados, além de propor um design gráfico flexível para uma boa visualização de
seus dados, porém é necessário seguir um ciclo de trabalho para que isso ocorra:
Lição 8: Quais os processos para uma boa atividade analítica?

É importante focar na extração de insight de dados, incluindo análise, coleta, organização


e armazenamento de dados, bem como ferramentas e técnicas para realizá-las, a fim de dar um
objetivo claro à visualização dos dados para que transmitam a informação de maneira adequada.
Para uma análise de dados adequada, é necessário que haja um planejamento, a fim de
estruturar a base das pesquisas, levantando informações aos seus critérios de coleta e
tratamento dos dados.

Lição 9: A Integração e a Qualidade dos dados


Para uma boa visualização de dados, é essencial considerarmos a comunicação, ciência
de dados e o design como elementos principais de integração e qualidade. Um resumo desta
análise pode ser observado no diagrama a seguir:
Dados: estão focados no conteúdo, na confiança e na identificação de oportunidades para
trazer soluções adequadas aos problemas que buscamos resolver;
História: está por trás da mensagem que desejamos passar e como podemos conduzir o
interlocutor a alcançar metas, objetivos ou planos de ações, por meio de técnicas de storytelling;
Design: é baseado nas características visuais para facilitar a cognição da mensagem, seja
por meio de fontes, legibilidade, tema e cores;
Compartilhamento: democratizar o conteúdo, difundindo ideias e explorando novas
soluções para resolução de problemas.
As visualizações de dados quando bem executadas fornecem percepções importantes sobre
os conjuntos de dados complexos de uma forma significativa e intuitiva.

O estatístico americano e professor Edward Tufte, de Yale, acredita que a ótima


visualização de dados consiste em “ideias complexas comunicadas com clareza, precisão e
eficiência”.
A Integração de dados na área industrial

Em um sistema de uma planta industrial, ele busca trazer diversos dados técnicos por meio
de seus sensores, dos mais variados processos, como análise de laboratórios, indicadores de
performance (KPI’s), reconciliação de dados para serem corrigidos, nível de estoque de produtos,
monitoramento de resultados financeiros, consumo de energia e planejamento da produção .
Todos esses dados podem e devem ser traduzidos para que se extraiam informações
importantes para agregar no desenvolvimento da empresa, trazendo valor para os negócios.
Módulo 2
Boas Práticas para o Data
Visualization
Lição 1: Objetivos do módulo
Este módulo busca orientar sobre as práticas de construção de uma boa visualização de
dados, por meio de exemplos e ferramentas visuais importantes para uma boa apresentação.

Responderemos perguntas do tipo:


✓ Como fazer melhores apresentações de dados?
✓ Quais ferramentas podem auxiliar a visualização de dados?
✓ Como a tecnologia influencia no Data Visualization?

Lição 2: A importância da identidade visual para dados

O público como elemento principal


Para garantir a transmissão do conteúdo e conhecimento dos dados, é importante entender
os recursos que compõem esse processo, a fim de direcionar a concentração da mensagem
abordada e compreender como o público processa as informações dos dados.
Sendo assim, os processos de comunicação visual nos ajudam a entender como direcionar
a atenção do público para onde você deseja que ele se concentre e podem ser usados para criar
uma hierarquia visual de elementos, para conduzi-lo pelas informações que você deseja
comunicar, de consigam analisar e assimilar os dados projetados.

➢ Estímulo: Ao estimular a visualização dos dados, uma boa identidade visual consegue
propor o estímulo de insights para solucionar o problema desejado;
➢ Visão: Um design agradável, claro e sem poluição visual facilita a assimilação;
➢ Cérebro: Garante a compreensão da percepção visual pelo cérebro.

Compreendendo o processo de comunicação visual, você entende como o público absorve


as informações e permite se posicionar melhor para uma comunicação mais eficiente.
Lição 3: A organização de tabelas para visualização
Há muitos tipos de tabelas e gráficos diferentes, para diversos tipos de exibições de
informações visuais, entretanto são poucos que atendem realmente às suas necessidades e
funcionalidades. Para a escolha desse visual eficaz é importante considerarmos alguns elementos:

Texto Simples
É válido ressaltar que na presença de poucos números, um simples texto pode ser um ótimo
elemento para se comunicar. Observe o exemplo a seguir, sobre um relatório do Pew Research
Center em abril de 2014 sobre mães que ficam em casa, baseadas com a situação de emprego em
1970 e 2012.

Apesar de apresentar números não significa que precisa necessariamente de um gráfico. O


gráfico em si não ajuda muito na interpretação, já que há a presença de muito texto e o espaço
ocupado é usado de uma forma exagerada. Assim, a informação bastaria ser transmitida com uma
simples frase para tornar mais atrativo.
Tabelas
As tabelas normalmente são utilizadas para comunicar várias unidades de medida
diferentes e comparar linhas, colunas e valores, além de comunicar um público misto, para que
cada indivíduo busque sua linha de interesse.

Os dados devem se sobressair mais que os componentes estruturais da tabela,


como é observado na segunda e terceira iterações abaixo.

O design de tabelas deve assumir um papel secundário, permitindo que os dados fiquem em
primeiro plano. Atenção para bordas grossas ou sombreado, não deixe que chamem a atenção.
Note que os dados se sobressaem mais que os componentes estruturais da tabela com bord as
claras ou simplesmente espaço branco para separar os elementos da tabela.

Mapas de Calor
Os Mapas de Calor formam um conjunto de detalhes em uma tabela utilizando pistas
visuais. É um modo de visualizar dados em formato tabular, uma vez que se utiliza células
coloridas para transmitir a magnitude relativa dos números.
Na tabela a seguir, observamos a dificuldade de encontrar os números mais altos ou baixos
estão localizados e para reduzir esse processo mental, podemos usar a saturação de cor a fim de
fornecer pistas visuais, isso facilita e agiliza o processo visual de distinguir os possíveis pontos de
interesse.
Lição 4: Como apresentar gráficos com qualidade
Os gráficos interagem com nosso sistema visual, o qual é mais rápido no processamento
de informações. Com um gráfico bem projetado, a comunicação se torna mais ágil. Assim,
podemos destacar os de uso mais comuns:

Gráfico de Pontos
Os gráficos de pontos são úteis para mostrar os dados quantitativos de uma forma
organizada, os mais conhecidos são os gráficos de dispersão, que são úteis para mostrar
relações entre dois elementos, codificando dados simultâneos. Tendem a ser bastante usados
nos campos científicos e no mundo dos negócios.
No exemplo abaixo, observamos a relação entre milhas dirigidas e o custo por milha de uma
frota de ônibus, por meio de um gráfico de dispersão. Nesse caso, se desejarmos focar nos custos
por milha acima da média, o gráfico pode ser modificado, projetando nossos olhos mais
rapidamente para os pontos acima.

Com a média projetada, o custo por milha é mais alto que a média quando abaixo de cerca
de 1.700 milhas ou acima de 3.300 milhas, para a amostra acima.

Gráfico de linhas
Há diversos tipos de gráficos de linhas, dentre eles o gráfico de linhas padrão é o mais
utilizado para registrar dados contínuos. Nessa categoria, esses dados geralmente indicam uma
unidade de tempo.
O gráfico de linha pode representar duas ou mais variáveis séries de dados, podemos
observar no exemplo a seguir, que o tempo está sendo representado no eixo x horizontal de um
gráfico de linhas padrão, em que os dados traçados devem estar em intervalos coerentes para
melhor visualização.

Em outros casos, a linha pode representar um resumo estatístico, como a média. Neste
modelo abaixo, há os tempos de espera mínimo, médio e máximo de um aeroporto em um período
de 13 meses, mostrando a média dentro de um intervalo.

Gráfico de barras
Os gráficos de barras buscam representar dados mais categóricos, em que a informação
possa ser organizada em grupos diferentes. Assim, é possível comparar pontos extremos relativos
e identificar a maior e menor categoria visualizada.
O uso da linha de barra zero permite observar melhor a diferença relativa entre as barras.
Devido ao modo como nossos olhos comparam os pontos extremos relativos das barras, é
importante ter o contexto da barra inteira para se fazer uma comparação precisa. Vejo o exemplo:
Ao considerar o comprimento de barras, verifique também sua largura. Não há uma regra
obrigatória, entretanto, é recomendável que as barras devam ter um tamanho relativamente mais
largas que o espaçamento ou intervalos entre elas.

Os gráficos de barras horizontais são recomendáveis quando os nomes das legendas


“categorias” forem longos, facilitando melhor a leitura. Eles também podem ser representados
para indicadores com duas ou mais séries.

Gráfico de áreas
Os gráficos de áreas, apesar de pouco usados, são interessantes para visualizar números
de magnitudes amplamente diferentes. Porém, quando mal utilizados, dificultam a leitura. O
gráfico de área quadrada permite que a análise seja feita de uma maneira mais compacta do que
é possível com apenas uma dimensão.
Lição 5: Como mostrar dados certos para pessoas certas

Por meio da tecnologia e novas ferramentas de manipulação de dados, qualquer pessoa


pode inserir dados em um aplicativo para criar elementos analíticos, entretanto também é
importante reconhecer quem é seu público de interesse.
Assim podemos analisar os mecanismos de comunicação com uma apresentação ao vivo e
em um documento escrito, considerando o nível de controle que o indivíduo tem sobre como a
informação é consumida.

✓ Nível de detalhamento: Baixo


✓ Controle de apresentação: Alto

Para apresentações ao vivo na presença de um público, você tem autonomia para


comandar os indícios visuais, o ritmo da apresentação e focar em pontos de interesse, uma vez
que você deve ter domínio sobre o conteúdo abordado.

✓ Nível de detalhamento: Alto


✓ Controle de apresentação: Baixo

Para documentos escritos ou relatórios, o público que consome a informação necessita


de um detalhamento maior, pensando nas possíveis perguntas e questionamentos que podem
surgir em relação ao material ou do tema abordado.
Por isso há a importância de identificar qual o principal veículo de comunicação a ser
utilizado: a apresentação ao vivo, documento escrito ou outro, uma vez que você terá total
autonomia sobre como seu público absorverá a informação e o nível de detalhe necessário se
tornarão muito importante para que o conteúdo comece a ser gerado.
Lição 6: Como contar histórias com dados?
O Storytelling torna-se uma habilidade importante em nosso mundo de dados crescentes e
de desejo de tomadas de decisão orientadas por dados. A visualização eficaz pode ser a
diferença entre o sucesso e o fracasso na comunicação, sempre seguindo uma estrutura lógica.
A capacidade de relacionar linguagem com números e contar histórias é uma habilidade que
contempla exploração e comunicação. Por isso a necessidade de entender o data storytelling:

“ Um método de transmitir mensagens derivadas de análises de dados complexos, de


forma a permitir que o público assimile rápida e facilmente determinado material.

Miriam Gilbert
Consultora de Negócios ”
Por conta disso, a criação do storyboard estabelece uma estrutura para sua comunicação,
para que o público não perca o pronto principal, além de definir o motivo e o porquê da ideia.
Além disso, à medida em que são trabalhados os detalhes da construção dessa forma de
comunicação, ela pode estar sofrendo alterações, para que se alcance o resultado desejado. Veja
sua estrutura a seguir:

Qual o problema? Recomendação final

Demonstração do Mostrar dados antes e


problema depois da avaliação

Ideias para superar o Descrever uma


problema solução

Para aprofundar melhor seus conhecimentos, veja nossa indicação de leitura do


PocketBook4You do livro “Storytelling com dados” de Cole Nussbaumer Knaflic, clicando aqui.
Lição 7: Os vieses cognitivos na análise de dados

É importante tomar cuidado na forma em que apresentamos dados e informações para obter
um conhecimento válido e compreensões objetivas. Dessa forma, para obter melhores
resultados que podem impactar nas tomadas de decisões é preciso ser bastante criterioso.
Assim, os vieses cognitivos são como atalhos para facilitar o processamento de
informações que nosso cérebro absorve. Entretanto, podem causar equívocos, erros de
julgamentos e distorção da compreensão dos fatos, os quais devem ser evitados.

Viés de Percepção
É a tendência de ser subjetivo quanto à coleta e interpretação de pesquisas e informações,
que por sua vez podem influenciar as pessoas a tomarem decisões equivocadas
inconscientemente. A presença do viés na análise de dados é extremamente prejudicial, pois
pode levar a resultados falsos e incompletos, sob o ponto de vista da empresa.

Como prevenir?
Estudos que usam medidas objetivas, baseadas em informações autorrelatadas ou
observações que podem ser influenciadas, devem ser interpretados com cautela.

Viés de Seleção
Afeta diretamente a seleção de dados não aleatórios para alguma análise. Ocorre quando
há uma falha no processo de seleção, em que o subconjunto dos dados é sistematicamente
excluído devido a algum tipo de critério.

Como prevenir?
É recomendável entender bem o que está sendo analisado, selecionado e como será a
metodologia utilizada, observando a quantidade, a variação e se o comportamento é
consistente ao longo do tempo.
Efeito de Auréola
Ocorre quando há uma tendência em avaliar traços e características baseadas em
impressões emocionais imediatas, exibindo preferências positivas, porém muitas vezes de
forma inadequada.

Como prevenir?
Busque ter atenção plena sobre os fatos e dados apresentados, dessa forma é possível
assegurar um nível elevado e adequado da objetividade no processo de avaliação.

Cuidados com o viés na análise de dados


Segundo a BigDataCorp (2018), as ferramentas de análise se propõem a encontrar
respostas e evidências baseadas em parâmetros que já existem, mas que acabam sendo muito
difíceis de enxergar a olho nu, devido à imensa quantidade de informações disponíveis, oriundas
de movimentações online e outros bancos de dados, como os financeiros e os sociais, mantidos
pelos governos.
Porém, ao analisarmos os impactos que isso pode ter na vida das pessoas, esses são ainda
mais extremos, pois podem se manifestar através de padrões discriminatórios e excludentes.
Por isso é importante tomar os seguintes cuidados:

As informações limitadas ou mal selecionadas podem favorecer a análise de


alguns dados indesejados;

Dados incompletos gerados pela coleta pouco rigorosa tornam a informação


pouco confiável;

Dados que não representam a população ou grupo, obtidos pela aplicação do


viés de seleção podem favorecer alguns grupos em desacordo com as restrições;

Dados que refletem resultados passados podem ser discriminatórios e


perpetuar vieses de forma não intencional.
Lição 8: As programações e o ETL
Devido à quantidade massiva de informações e dados brutos no ciberespaço, as ferramentas
de programações e softwares surgiram para eliminar problemas de integração, complexidade
dos processos e geração de resultados satisfatórios.
Sendo assim, o ETL (“Extract”, “Transform” e “Load”) busca a extração de dados de
diversas fontes ou origens, para transformá-los em processos padronizados que tragam
consistência às informações e posteriormente proporcionem um ambiente de consultas e
análises, é conhecido como Data Warehouse.

1. Extrair: A primeira etapa do processo de ETL é baseada na extração de dados de


todas as fontes disponíveis e relevantes para compilação. Isso inclui uma preparação
necessária para realização e integração das informações para que se obtenha
insights por meio do processo analítico.
2. Transformar: Os dados extraídos são tratados (compilados, convertidos,
reformatados e limpos) para integrar na base de dados. É essencial um bom
tratamento desses dados para uma maior confiabilidade e qualidade das informações.
3. Carregar: É uma abordagem para inserção de cada registro destinada ao banco de
dados, seja ela manual ou pelo carregamento massivo de dados, que é ideal para um
conjunto de dados integrados e que não contenha erros.

Vale ressaltar que os processos de ETL são de suma importância para as atividades
analíticas, podendo destacar alguns elementos principais:

1 Migração de dados entre aplicativos;

2 Replicação de dados para backup ou análise de redundância;

3 Armazenamento em um Data Warehouse para transformação de um


ambiente de business intelligence (BI);

4 Processamento operacional para melhorar sistemas;


Ex: Sistema CRM para um ODS (Operational Data Store)

5 Sincronização de sistemas e armazenamento em nuvem.


Lição 9: A visualização de dados em Python e R
A visualização de dados envolve a capacidade do sistema visual humano de identificar
padrões, de forma que possibilite o rápido entendimento e compreensão da informação. Nesse
sentido, para ampliar as relações de conhecimento dentro de seus negócios, disponibilizar
gráficos, infográficos e tabelas com o resultado dos dados é fundamental o uso de ferramentas e
softwares de tratamento e aplicação.
Dentre elas, e possível destacar 2 ferramentas de programação:
➢ Python: Ferramenta capaz de desenvolver programas e automação, atuantes na
área de Data Science e Machine Learning.
➢ Linguagem R: É uma linguagem para computação estatísticas e gráficas que
fornece grande variedades de modelos para análises e tratamentos de dados.

A visualização de dados com Python oferece suporte visual intuitivo na construção de


gráficos e tabelas baseadas em estatísticas descritivas para apresentação de resultados
analíticos. Isso é possível por meio do uso de bibliotecas.

Matplotlib
Uma coleção de funções capaz de criar e plotar gráficos em geral, para visualizações
estatísticas, animadas e interativas em Python.
Seaborn
Atua em conjunto com Matplotlib, para otimização visual de gráficos e tabelas, o qual
fornece uma interface para gerar gráficos estatísticos atraentes e informativos.
Gráfico de Área

Autor: Waskom, 2021

Geoplotlib
Possibilita a criação e plotagem para visualização de dados geográficos e muitas outras
visualizações espaciais em comum.
Mapa de Calor

Autor: Cuttone, 2021

Lição 10: Aprendendo com exemplos práticos


Para uma aplicação de uma visualização de dados mais influente, interessante e
reveladora, é necessário explorar o lado criativo e inovador, por meio dos dados úteis e cativantes,
além da capacidade analítica e conhecimentos sobre design gráfico e saber contar histórias.
Na empresa The Pudding, a visualização de dados criada por Hanna Anderson e Matt
Daniels conseguem representar visualmente a desigualdade de gênero na cultura pop de cerca
de 2.000 roteiros de filmes. A visualização calcula também o total de falas de diálogo de
personagens masculinos e femininos.

Com essa visualização observamos uma análise de desigualdades de gênero, examinando


a quantidade de roteiros em falas de diálogos de filmes e destacando a falta do protagonismo
feminino e o desiquilíbrio entre a participação entre gêneros.
O centro de pesquisa Pew Research Center faz uma análise dos dados demográficos dos
Estados Unidos e os reúne em uma plataforma interativa de visualização de dados. O projeto
mostra a tendência e mudanças demográficas que podem ocorrer no país nãos próximos anos.
Para conhecer a plataforma interativa clique aqui.
Já a empresa The Washington Post criou uma outra visualização interativa do globo terrestre
capaz de mostrar o trajeto do eclipse, identificando quando e em quais partes do mundo o fenômeno
ocorrerá. Para conhecer um pouco mais clique aqui.

Lição 11: A relação do Design Thinking para visualização de dados


O Design Thinking no mundo dos negócios está ganhando cada vez mais destaque como
um método estratégico nas organizações. Então, podemos destacar que o seu objetivo principal
do é

Enxergar algo com novos olhos, além do óbvio, longe da forma habitual
ou convencional.
Assim, esse método estratégico permite o movimento de ideias ao longo do funil do
conhecimento, obtendo vantagem competitiva de longo prazo.

O Funil do Conhecimento
O design thinking é uma forma de pensamento que permite o fluxo de ideias pelo funil do
conhecimento, o qual é composto por três elementos principais: mistério, heurística e algoritmo.

➢ Mistério: Analisar um problema, que pode envolver uma série de áreas diferentes;
➢ Heurística: Restringir o campo de investigação para simplificar a compreensão;
➢ Algoritmo: Adoção da prática para uma solução eficiente do problema definido.

Principalmente nos campos da “heurística” e do “algoritmo”, a visualização de dados


procura adotar métodos e recursos gráficos que simplifiquem as análises de informações, de
maneira com que o público entenda claramente o conteúdo ou ideia transmitida, refinando as
complexidades de um assunto ou área e auxiliando na obtenção daquele conhecimento.

Visual Thinking
Também conhecido como pensamento visual, o qual ocorre tanto para divergir, gerar
ideias, como para convergir, auxiliando em tomadas de decisão e sintetizando novos insights.
O estímulo do visual thinking, propõe a transmissão de ideias por meio de desenhos
simples que conseguem elucidar dados complexos, fazendo com que sejam entendidos de
maneira mais eficaz por diversos públicos. Além disso, ele está relacionado com a criatividade e
a ativação de elementos visuais na criação de imagens mentais, as quais são responsáveis pela
aceleração e ao estímulo do aprendizado de modo diferenciado.

Design Thinking e inovação


A inovação é um conceito presente em empresas e que auxilia nas mais diversas áreas a
terem uma nova visão sobre seu negócio e proporcionar planejamentos estratégicos de
diferenciação no mercado atuante. Ou seja, inovação é ver algo com novos olhos, além do óbvio,
longe da forma habitual ou convencional.
A partir disso, pesquisadores da IDEO (empresa internacional de design e consultoria em
inovação) propõem 3 pilares principais para o processo de design thinking:

❖ Inspiração: relacionada ao problema ou oportunidade que procura soluções;


❖ Idealização: se refere ao processo de gerar um grande volume de ideia e testá-las;
❖ Implementação: é o caminho percorrido pelo produto ou serviço desenvolvido.

O processo do design thinking possui um viés exploratório, mas não necessariamente


seguem uma espécie de passo-a-passo, mas que as etapas podem ser combinadas quantas vezes
forem necessárias, caso o elemento desenvolvido ainda precise ser aprimorado.
Como exemplo principal, podemos observar a construção de infográficos:
Infográfico da Revista Superinteressante

Nesse caso, o infográfico é uma ótima aplicação do pensamento visual ligado ao conceito
de criatividade, explorando diferentes formas de abordagem dos elementos visuais, dentre eles a
união de um aglomerado de informações complexas, porém sem afetar a compreensão, criando
uma empatia com os dados para tornar a visualização desses dados mais atrativos.
Além disso, o exemplo expõe uma relação entre o funil do conhecimento e a visualização,
uma vez que ambos procuram propor uma tradução dos dados analisados de maneira sintética e
elucidativa das informações contidas, para que possam ser absorvidas de forma eficiente, seja
por um gestor ou pelo público-alvo.

Lição 12: A visualização de dados para resultados e análises


Os dados devem ser apresentados de maneira objetiva e clara durante sua visualização, a
qual permite que os tomadores de decisão vejam os resultados de análises visualmente para
compreender a informação.

Para isso, considere os 4 objetivos para transmitir uma mensagem!

1. Comparar: compare dados, use histogramas, tabelas ou curvas.


2. Destacar: destaque a composição de um elemento, use gráficos de pizza.
3. Mostrar: mostre como os dados estão distribuídos, use gráficos de dispersão.
4. Visualizar: visualize a correlação entre os valores.
Referências
A beleza dos dados: dez excelentes exemplos de visualizações de dados do passado e do
presente. Tableau, 2021. Disponível em: https://www.tableau.com/pt-br/learn/articles/best-
beautiful-data-visualization-examples . Acesso em: 16 de dezembro de 2021.

Catalogue of Bias Collaboration, Nunan D, Bankhead C, Aronson JK. Selection bias. Catalogue Of
Bias 2017. Disponível em: http://www.catalogofbias.org/biases/selection -bias/ . Acesso em: 15 de
dezembro de 2021.

Catalogue of Bias Collaboration, Spencer EA, Brassey JR. Perception bias. In: Catalogue Of
Bias2017. Disponível em: https://www.catalogofbias.org/biases/perception -bias . Acesso em: 15
de dezembro de 2021.

CUTTONE, Andrea. Python Data Visualization Libraries for Business Analytics. Mode, 2021.
Disponível em: https://mode.com/blog/python-data-visualization-libraries/ . Acesso em: 14 de
Dezembro de 2021.

FERNANDES, Jonas. Como os vieses cognitivos podem impactar a análise de dados. Medium,
2020. Disponível em: https://jonastadeu1.medium.com/como-os-vieses-cognitivos-podem-
impactar-a-an%C3%A1lise-de-dados-b420428829cb . Acesso em: 14 de dezembro de 2021.

Gilbert, M. (2014). Data stories - how to combine the power storytelling with effective data
visualization. Recuperado https://pt.slideshare.net/miriamgilbert08/data-stories-workshop-
34390209. Acesso em: 15 de dezembro de 2021.

HUNTER, John. DALE, Darren. FIRING, Eric. DROETTBOOM, Michael. Plot Types. Matplotlib.
Disponível em: https://matplotlib.org/stable/plot_types/index.html . Acesso em: 14 de dezembro de
2021.

KNAFLIC, Cole Nussbaumer. Storytelling com dados: um guia sobre visualização de dados para
profissionais de negócios. Traduzido por João Tortello. Alta Books. Rio de Janeiro. 2017.

Teixeira, Carla. Criatividade, Design Thinking e Visual Thinking e sua relação com o universo da
infografia e da visualização de dados. Tese Doutorado. Rio de Janeiro. 2014.

WASKOM, Michael. Example Gallery. Seaborn, 2012-2021. Disponível em :


https://seaborn.pydata.org/examples/spreadsheet_heatmap.html . Acesso em: 14 de dezembro
2021.

Você também pode gostar