Escolar Documentos
Profissional Documentos
Cultura Documentos
de Data
Visualization
com Mariana Kobayashi
Sumário
Módulo 1............................................................................................................................................................ 5
Lição 1: Objetivos do módulo......................................................................................................................... 6
Lição 2: Por que devemos estudar sobre o Data Visualization? .................................................................. 6
Uma perspectiva dos analistas .................................................................................................................. 6
Os dados são usados para tudo ................................................................................................................ 6
Por que usar a visualização de dados ....................................................................................................... 7
Lição 3: Quais os benefícios de uma boa visualização de dados? .............................................................. 8
O que é o Data Visualization? .................................................................................................................... 8
Os principais benefícios ............................................................................................................................. 8
Exemplo de Data Visualization................................................................................................................... 8
Lição 4: Relação de Data Visualization com a cultura Data Driven.............................................................. 9
O que é a cultura Data Driven? .................................................................................................................. 9
As diferenças entre orientar e informar dados ........................................................................................... 9
As etapas para alcançar o Data Driven ................................................................................................... 10
Sua relação com o Data Visualization ..................................................................................................... 10
Lição 5: A percepção visual na visualização de dados ............................................................................... 11
Os fluxos de informações em larga escala .............................................................................................. 11
Como promover o estímulo visual?.......................................................................................................... 11
O princípio da Proximidade ...................................................................................................................... 12
O princípio da Similaridade ...................................................................................................................... 12
O princípio do Acercamento ..................................................................................................................... 13
O princípio do Fechamento ...................................................................................................................... 13
O princípio da Continuidade ..................................................................................................................... 14
O princípio da Conexão ............................................................................................................................ 14
Lição 6: As classificações de análise de dados .......................................................................................... 16
A Análise Descritiva .................................................................................................................................. 16
A Análise Diagnóstico............................................................................................................................... 16
A Análise Preditiva.................................................................................................................................... 17
A Análise Prescritiva................................................................................................................................. 17
Lição 7: As melhores ferramentas de apresentações de dados................................................................. 18
Ciclo de Trabalho pelas Ferramentas de BI ............................................................................................ 18
Lição 8: Quais os processos para uma boa atividade analítica?................................................................ 19
Lição 9: A Integração e a Qualidade dos dados ......................................................................................... 19
A Integração de dados na área industrial ................................................................................................ 21
Módulo 2.......................................................................................................................................................... 22
Lição 1: Objetivos do módulo....................................................................................................................... 23
Lição 2: A importância da identidade visual para dados ............................................................................. 23
O público como elemento principal .......................................................................................................... 23
Lição 3: A organização de tabelas para visualização ................................................................................. 24
Texto Simples ........................................................................................................................................... 24
Tabelas ..................................................................................................................................................... 25
Mapas de Calor ........................................................................................................................................ 25
Lição 4: Como apresentar gráficos com qualidade ..................................................................................... 26
Gráfico de Pontos ..................................................................................................................................... 26
Gráfico de linhas ....................................................................................................................................... 26
Gráfico de barras ...................................................................................................................................... 27
Gráfico de áreas ....................................................................................................................................... 28
Lição 5: Como mostrar dados certos para pessoas certas......................................................................... 29
Lição 6: Como contar histórias com dados? ............................................................................................... 30
Lição 7: Os vieses cognitivos na análise de dados..................................................................................... 31
Viés de Percepção.................................................................................................................................... 31
Viés de Seleção ........................................................................................................................................ 31
Efeito de Auréola ...................................................................................................................................... 32
Cuidados com o viés na análise de dados .............................................................................................. 32
Lição 8: As programações e o ETL ............................................................................................................. 33
Lição 9: A visualização de dados em Python e R ....................................................................................... 34
Matplotlib................................................................................................................................................... 34
Seaborn..................................................................................................................................................... 35
Geoplotlib .................................................................................................................................................. 35
Lição 10: Aprendendo com exemplos práticos ........................................................................................... 35
Lição 11: A relação do Design Thinking para visualização de dados......................................................... 36
O Funil do Conhecimento ......................................................................................................................... 37
Visual Thinking ......................................................................................................................................... 37
Design Thinking e inovação ..................................................................................................................... 37
Lição 12: A visualização de dados para resultados e análises................................................................... 39
Referências .................................................................................................................................................. 40
Direitos desta edição reservados
A Voitto Treinamento e Desenvolvimento
www.voitto.com.br
Mariana Kobayashi é formada em engenharia química pela Escola Politécnica de São Paulo.
Mestre em Energia e Processos de Refino pelo Instituto Francês do Petróleo, trabalha como
Coordenadora de projetos de transformação digital, contribuindo para projetos como "Refinaria 4.0",
atuando também como Facilitadora de Transformação Digital, ajudando a possibilitar a integração
de dados, análise de dados, projetos de BI e implementação de modelos de aprendizagem de
máquinas no ramo de refino e petroquímica. Co-founder de duas start-ups, uma na área de green
hydrogen e outra em consultoria em transformação digital e dados. É professora de transformação
digital e análise de dados no Instituto Francês do Petróleo e ENSGTI, ambos na França.
É PROIBIDA A REPRODUÇÃO
Nenhuma parte desta obra poderá ser reproduzida, copiada, transcrita ou mesmo transmitida
por meios eletrônicos ou gravações sem a permissão, por escrito, do editor. Os infratores
serão punidos pela Lei n° 9.610/98
Módulo 1
Compreendendo o Data Visualization
Lição 1: Objetivos do módulo
Nesse módulo você vai aprender quais são os fundamentos do Data Visualization, qual sua
importância dentro do processo analítico de dados e seus benefícios. Além de explicações teóricas
e aplicações práticas da implementação de elementos visuais e exemplos atuais.
Os principais benefícios
1. Compartilhável
Facilitam os processos de aprendizagem e gestão do conhecimento para uma melhor
compreensão dos dados em um grupo.
2. Tomada de Decisões
Garantem confiança e tomadas de decisões ágeis de decisões fundamentos nos dados
disponíveis, obtendo insight mais claros e precisos.
3. Alto Impacto
Por meio de tabelas, gráficos e dashboards, esses elementos visuais tornam a apresentação
de dados mais dinâmica e eficaz.
1 2 3
Utilização de dados para Validação dos Execução de acordo com
orientar a decisão planos de ação os objetivos estabelecidos
Informação
Agrupamentos
Além disso, podemos diferenciá-los por meio de espaçamentos entre os pontos. Seus olhos
podem ser atraídos pelas colunas ou pelas linhas, como nos exemplos a seguir:
Colunas Linhas
O princípio da Similaridade
Naturalmente, você pode associar os elementos como cor, formas, tamanhos e orientações
semelhantes que podem ser notados quando pertencem a um mesmo grupo ou segmento. Esse
princípio ajuda a chamar a atenção do público para onde desejamos focar e esse tipo de recurso
pode ser aproveitado em tabelas.
Além disso, outro modo de aproveitar este princípio é traçar uma distinção visual de nossos
dados. Isso pode ser realizado por meio de áreas sombreadas também.
O princípio do Fechamento
Para tornar a visualização mais simples e intuitivas em nossas mentes, tendemos a
perceber um conjunto de elementos individuais como uma única forma reconhecível. É comum os
aplicativos de geração de gráficos terem um padrão de elementos como bordas e sombreados de
fundo. Mas, de acordo com o princípio do fechamento, muitas vezes tornam-se desnecessários e
ao retirá-los damos maior destaque aos nossos dados.
Separação de objetos
O princípio da Conexão
Normalmente, a propriedade conectiva tem valor associativo mais forte em relação a cores,
tamanhos ou formas similares. No exemplo a seguir, nossos olhos tendem a montar pares das
formas conectadas por linhas. O princípio da conexão não é mais forte que o acercamento, mas
pode afetar essa relação, por meio de espessuras ou tonalidades, criando hierarquias visuais.
Pares de f ormas com linhas
Já em gráficos, um uso frequentes deste princípio pode ser observado nos gráficos de
linhas, para ajudar nossos olhos a ver uma relação de ordem nos dados.
A Análise Descritiva
Análise
Prescritiva
Valor
Análise
Preditiva
Análise
Diagnóstico
Análise
Descritiva
Complexidade
Utiliza dados históricos e atuais de várias fontes para descrever o estado atual,
identificando tendências e padrões. Em análise de negócios, esse é o escopo da inteligência de
negócios (BI).
A Análise Diagnóstico
Análise
Prescritiva
Valor
Análise
Preditiva
Análise
Diagnóstico
Análise
Descritiva
Complexidade
Geralmente, utilizam-se dados gerados pela análise descritiva para descobrir fatores ou
razões de desempenhos anteriores.
A Análise Preditiva
Análise
Prescritiva
Valor
Análise
Preditiva
Análise
Diagnóstico
Análise
Descritiva
Complexidade
A Análise Prescritiva
Análise
Prescritiva
Valor
Análise
Preditiva
Análise
Diagnóstico
Análise
Descritiva
Complexidade
➢ Ferramentas como Power BI e Excel são as mais comuns entre as empresas, por
meio do uso de dashboards;
Em um sistema de uma planta industrial, ele busca trazer diversos dados técnicos por meio
de seus sensores, dos mais variados processos, como análise de laboratórios, indicadores de
performance (KPI’s), reconciliação de dados para serem corrigidos, nível de estoque de produtos,
monitoramento de resultados financeiros, consumo de energia e planejamento da produção .
Todos esses dados podem e devem ser traduzidos para que se extraiam informações
importantes para agregar no desenvolvimento da empresa, trazendo valor para os negócios.
Módulo 2
Boas Práticas para o Data
Visualization
Lição 1: Objetivos do módulo
Este módulo busca orientar sobre as práticas de construção de uma boa visualização de
dados, por meio de exemplos e ferramentas visuais importantes para uma boa apresentação.
➢ Estímulo: Ao estimular a visualização dos dados, uma boa identidade visual consegue
propor o estímulo de insights para solucionar o problema desejado;
➢ Visão: Um design agradável, claro e sem poluição visual facilita a assimilação;
➢ Cérebro: Garante a compreensão da percepção visual pelo cérebro.
Texto Simples
É válido ressaltar que na presença de poucos números, um simples texto pode ser um ótimo
elemento para se comunicar. Observe o exemplo a seguir, sobre um relatório do Pew Research
Center em abril de 2014 sobre mães que ficam em casa, baseadas com a situação de emprego em
1970 e 2012.
O design de tabelas deve assumir um papel secundário, permitindo que os dados fiquem em
primeiro plano. Atenção para bordas grossas ou sombreado, não deixe que chamem a atenção.
Note que os dados se sobressaem mais que os componentes estruturais da tabela com bord as
claras ou simplesmente espaço branco para separar os elementos da tabela.
Mapas de Calor
Os Mapas de Calor formam um conjunto de detalhes em uma tabela utilizando pistas
visuais. É um modo de visualizar dados em formato tabular, uma vez que se utiliza células
coloridas para transmitir a magnitude relativa dos números.
Na tabela a seguir, observamos a dificuldade de encontrar os números mais altos ou baixos
estão localizados e para reduzir esse processo mental, podemos usar a saturação de cor a fim de
fornecer pistas visuais, isso facilita e agiliza o processo visual de distinguir os possíveis pontos de
interesse.
Lição 4: Como apresentar gráficos com qualidade
Os gráficos interagem com nosso sistema visual, o qual é mais rápido no processamento
de informações. Com um gráfico bem projetado, a comunicação se torna mais ágil. Assim,
podemos destacar os de uso mais comuns:
Gráfico de Pontos
Os gráficos de pontos são úteis para mostrar os dados quantitativos de uma forma
organizada, os mais conhecidos são os gráficos de dispersão, que são úteis para mostrar
relações entre dois elementos, codificando dados simultâneos. Tendem a ser bastante usados
nos campos científicos e no mundo dos negócios.
No exemplo abaixo, observamos a relação entre milhas dirigidas e o custo por milha de uma
frota de ônibus, por meio de um gráfico de dispersão. Nesse caso, se desejarmos focar nos custos
por milha acima da média, o gráfico pode ser modificado, projetando nossos olhos mais
rapidamente para os pontos acima.
Com a média projetada, o custo por milha é mais alto que a média quando abaixo de cerca
de 1.700 milhas ou acima de 3.300 milhas, para a amostra acima.
Gráfico de linhas
Há diversos tipos de gráficos de linhas, dentre eles o gráfico de linhas padrão é o mais
utilizado para registrar dados contínuos. Nessa categoria, esses dados geralmente indicam uma
unidade de tempo.
O gráfico de linha pode representar duas ou mais variáveis séries de dados, podemos
observar no exemplo a seguir, que o tempo está sendo representado no eixo x horizontal de um
gráfico de linhas padrão, em que os dados traçados devem estar em intervalos coerentes para
melhor visualização.
Em outros casos, a linha pode representar um resumo estatístico, como a média. Neste
modelo abaixo, há os tempos de espera mínimo, médio e máximo de um aeroporto em um período
de 13 meses, mostrando a média dentro de um intervalo.
Gráfico de barras
Os gráficos de barras buscam representar dados mais categóricos, em que a informação
possa ser organizada em grupos diferentes. Assim, é possível comparar pontos extremos relativos
e identificar a maior e menor categoria visualizada.
O uso da linha de barra zero permite observar melhor a diferença relativa entre as barras.
Devido ao modo como nossos olhos comparam os pontos extremos relativos das barras, é
importante ter o contexto da barra inteira para se fazer uma comparação precisa. Vejo o exemplo:
Ao considerar o comprimento de barras, verifique também sua largura. Não há uma regra
obrigatória, entretanto, é recomendável que as barras devam ter um tamanho relativamente mais
largas que o espaçamento ou intervalos entre elas.
Gráfico de áreas
Os gráficos de áreas, apesar de pouco usados, são interessantes para visualizar números
de magnitudes amplamente diferentes. Porém, quando mal utilizados, dificultam a leitura. O
gráfico de área quadrada permite que a análise seja feita de uma maneira mais compacta do que
é possível com apenas uma dimensão.
Lição 5: Como mostrar dados certos para pessoas certas
Miriam Gilbert
Consultora de Negócios ”
Por conta disso, a criação do storyboard estabelece uma estrutura para sua comunicação,
para que o público não perca o pronto principal, além de definir o motivo e o porquê da ideia.
Além disso, à medida em que são trabalhados os detalhes da construção dessa forma de
comunicação, ela pode estar sofrendo alterações, para que se alcance o resultado desejado. Veja
sua estrutura a seguir:
É importante tomar cuidado na forma em que apresentamos dados e informações para obter
um conhecimento válido e compreensões objetivas. Dessa forma, para obter melhores
resultados que podem impactar nas tomadas de decisões é preciso ser bastante criterioso.
Assim, os vieses cognitivos são como atalhos para facilitar o processamento de
informações que nosso cérebro absorve. Entretanto, podem causar equívocos, erros de
julgamentos e distorção da compreensão dos fatos, os quais devem ser evitados.
Viés de Percepção
É a tendência de ser subjetivo quanto à coleta e interpretação de pesquisas e informações,
que por sua vez podem influenciar as pessoas a tomarem decisões equivocadas
inconscientemente. A presença do viés na análise de dados é extremamente prejudicial, pois
pode levar a resultados falsos e incompletos, sob o ponto de vista da empresa.
Como prevenir?
Estudos que usam medidas objetivas, baseadas em informações autorrelatadas ou
observações que podem ser influenciadas, devem ser interpretados com cautela.
Viés de Seleção
Afeta diretamente a seleção de dados não aleatórios para alguma análise. Ocorre quando
há uma falha no processo de seleção, em que o subconjunto dos dados é sistematicamente
excluído devido a algum tipo de critério.
Como prevenir?
É recomendável entender bem o que está sendo analisado, selecionado e como será a
metodologia utilizada, observando a quantidade, a variação e se o comportamento é
consistente ao longo do tempo.
Efeito de Auréola
Ocorre quando há uma tendência em avaliar traços e características baseadas em
impressões emocionais imediatas, exibindo preferências positivas, porém muitas vezes de
forma inadequada.
Como prevenir?
Busque ter atenção plena sobre os fatos e dados apresentados, dessa forma é possível
assegurar um nível elevado e adequado da objetividade no processo de avaliação.
Vale ressaltar que os processos de ETL são de suma importância para as atividades
analíticas, podendo destacar alguns elementos principais:
Matplotlib
Uma coleção de funções capaz de criar e plotar gráficos em geral, para visualizações
estatísticas, animadas e interativas em Python.
Seaborn
Atua em conjunto com Matplotlib, para otimização visual de gráficos e tabelas, o qual
fornece uma interface para gerar gráficos estatísticos atraentes e informativos.
Gráfico de Área
Geoplotlib
Possibilita a criação e plotagem para visualização de dados geográficos e muitas outras
visualizações espaciais em comum.
Mapa de Calor
Enxergar algo com novos olhos, além do óbvio, longe da forma habitual
ou convencional.
Assim, esse método estratégico permite o movimento de ideias ao longo do funil do
conhecimento, obtendo vantagem competitiva de longo prazo.
O Funil do Conhecimento
O design thinking é uma forma de pensamento que permite o fluxo de ideias pelo funil do
conhecimento, o qual é composto por três elementos principais: mistério, heurística e algoritmo.
➢ Mistério: Analisar um problema, que pode envolver uma série de áreas diferentes;
➢ Heurística: Restringir o campo de investigação para simplificar a compreensão;
➢ Algoritmo: Adoção da prática para uma solução eficiente do problema definido.
Visual Thinking
Também conhecido como pensamento visual, o qual ocorre tanto para divergir, gerar
ideias, como para convergir, auxiliando em tomadas de decisão e sintetizando novos insights.
O estímulo do visual thinking, propõe a transmissão de ideias por meio de desenhos
simples que conseguem elucidar dados complexos, fazendo com que sejam entendidos de
maneira mais eficaz por diversos públicos. Além disso, ele está relacionado com a criatividade e
a ativação de elementos visuais na criação de imagens mentais, as quais são responsáveis pela
aceleração e ao estímulo do aprendizado de modo diferenciado.
Nesse caso, o infográfico é uma ótima aplicação do pensamento visual ligado ao conceito
de criatividade, explorando diferentes formas de abordagem dos elementos visuais, dentre eles a
união de um aglomerado de informações complexas, porém sem afetar a compreensão, criando
uma empatia com os dados para tornar a visualização desses dados mais atrativos.
Além disso, o exemplo expõe uma relação entre o funil do conhecimento e a visualização,
uma vez que ambos procuram propor uma tradução dos dados analisados de maneira sintética e
elucidativa das informações contidas, para que possam ser absorvidas de forma eficiente, seja
por um gestor ou pelo público-alvo.
Catalogue of Bias Collaboration, Nunan D, Bankhead C, Aronson JK. Selection bias. Catalogue Of
Bias 2017. Disponível em: http://www.catalogofbias.org/biases/selection -bias/ . Acesso em: 15 de
dezembro de 2021.
Catalogue of Bias Collaboration, Spencer EA, Brassey JR. Perception bias. In: Catalogue Of
Bias2017. Disponível em: https://www.catalogofbias.org/biases/perception -bias . Acesso em: 15
de dezembro de 2021.
CUTTONE, Andrea. Python Data Visualization Libraries for Business Analytics. Mode, 2021.
Disponível em: https://mode.com/blog/python-data-visualization-libraries/ . Acesso em: 14 de
Dezembro de 2021.
FERNANDES, Jonas. Como os vieses cognitivos podem impactar a análise de dados. Medium,
2020. Disponível em: https://jonastadeu1.medium.com/como-os-vieses-cognitivos-podem-
impactar-a-an%C3%A1lise-de-dados-b420428829cb . Acesso em: 14 de dezembro de 2021.
Gilbert, M. (2014). Data stories - how to combine the power storytelling with effective data
visualization. Recuperado https://pt.slideshare.net/miriamgilbert08/data-stories-workshop-
34390209. Acesso em: 15 de dezembro de 2021.
HUNTER, John. DALE, Darren. FIRING, Eric. DROETTBOOM, Michael. Plot Types. Matplotlib.
Disponível em: https://matplotlib.org/stable/plot_types/index.html . Acesso em: 14 de dezembro de
2021.
KNAFLIC, Cole Nussbaumer. Storytelling com dados: um guia sobre visualização de dados para
profissionais de negócios. Traduzido por João Tortello. Alta Books. Rio de Janeiro. 2017.
Teixeira, Carla. Criatividade, Design Thinking e Visual Thinking e sua relação com o universo da
infografia e da visualização de dados. Tese Doutorado. Rio de Janeiro. 2014.