Escolar Documentos
Profissional Documentos
Cultura Documentos
de Dados
Patrícia Novais
01
Sumário
Anscombe
Anscombe
média de x 9.0
média de y 7.5
var x 11
var y 4.12
correlation 0.816
Quarteto de 04
Anscombe
Design
Design
Design
Design
Design
Design
1. Como exibir as informações dos gráficos abaixo de maneira mais eficiente? Faça, usando
apenas papel e caneta, um esboço de como os dados poderiam ser melhor apresentados.
18
Melhor gráfico para o
melhor dado
» Existem hoje diversas bibliotecas em Python para criação de gráficos. Dentre as várias
possibilidades, exploraremos aqui as duas mais comuns: Matplotlib e Seaborn.
» Em cada biblioteca, considerando os principais tipos de dados, iremos apresentar alguns
dos tipos de gráficos mais comuns.
20
Matplotib – Primeiros
passos
» Importando a biblioteca
» Existem diversos outros parâmetros (argumentos) que podem ser utilizados para
personalizar o gráfico.
» Pode-se encontrar todos os argumentos nas documentações do Matplotlib.
25
Matplotib – Adicionando
outros elementos
Três gráficos e
alguns elementos
Dois gráficos adicionais
27
Matplotlib – Múltiplos
subgráficos
» Existem diversos tipos de gráficos que podem ser feitos com a biblioteca Matplotlib.
» Alguns serão explorados a seguir (tanto em Matplotlib quanto em Seaborn), mas dentre as possibilidades,
podemos citar:
» Gráficos lineares
» Gráficos de dispersão
» Gráficos de barras
» Histogramas Verifique a galeria da biblioteca
Matplotlib para encontrar
» Boxplots diversos exemplos de uso:
» Imagens
https://matplotlib.org/3.1.1/galler
» Tridimensionais y/index.html
» Gráficos de fluxos de campo
» Gráficos polares
29
Exercícios - Matplotlib
elaborados
» Seaborn é uma biblioteca baseada em Matplotlib que traz uma interface mais atraente para
os gráficos.
» Traz facilidades para modificarmos os parâmetros default do Matplotlib
» Permite usar dataframes
» Importando a biblioteca:
31
Seaborn – Datasets
embutidos
» O Seaborn possui diversos dados já embutidos que podem ser utilizados para estudar a
própria biblioteca. Para sabermos quais os datasets disponíveis, podemos utilizar a função
get_dataset_names().
32
Seaborn – Datasets
embutidos
» O Seaborn possui a função set() que permite já ajustar estilos específicos para os gráficos,
sem a necessidade de ajustar manualmente todos os argumentos.
» O estilo default do Seaborn é o darkgrid, mas há ainda os estilos whitegrid, dark, white, e
ticks que podem ser escolhidos com a função set_style().
Seaborn – Gráficos 35
estarísticos
displot (univariada)
Seaborn – 37
pairplot (bivariada)
» A função pairplot() é outra função muito útil quando usamos os gráficos como recurso
exploratório.
» A função pairplot() exibe a relação 2 a 2 entre as variáveis, de modo que facilite a busca por
correlações entre as variáveis de um conjunto de dados.
» Exibe dados numéricos, embora dados categóricos possam ser utilizados para discriminar os
dados.
Seaborn – 38
pairplot (bivariada)
Seaborn – 39
Dados categóricos
Dados categóricos
Qual a principal
diferença entre os
dois gráficos?
Seaborn – 41
Dados categóricos
Os gráficos barplot() e boxplot() são gráficos em que analisamos a relação entre dados
contínuos e categóricos.
42
Exercícios - Seaborn
gráficos
» Mais do que apenas saber fazer gráficos, precisamos saber analisá-los para extrairmos
informações.
» Iremos pontuar alguns elementos importantes a analisar quando utilizamos alguns tipos
de dados.
44
Gráficos de dispersão
com linhas
Matplotlib Seaborn
46
Histogramas
» É preciso atenção ao tamanho dos bins do histograma, pois pode induzir a conclusões
diferentes.
Matplotlib Seaborn
49
Boxplots
» A linha central mostra a mediana dos valores e os limites da caixa exibem o primeiro e
terceiro quartis.
» As linhas externas exibem os limites inferior e superior
» Se houver dados discrepantes (outliers), serão exibidos após as linhas externas.
50
Barplots
densidade