Escolar Documentos
Profissional Documentos
Cultura Documentos
ANÁLISE
EXPLORATÓRIA DE
DADOS
Rafael Albuquerque
Gráficos de barras
com Seaborn
Objetivos de aprendizagem
Ao final deste texto, você deve apresentar os seguintes aprendizados:
Introdução
A visualização de dados tem ajudado bastante no processo de análise
dos dados, pois ela permite a extração de insights a partir dos dados
plotados; em outras palavras, ela auxilia na interpretação dos dados de
maneira clara e fácil. Geralmente, os dados que mais são utilizados nessas
visualizações são os dados categóricos discretos e os numéricos contínuos.
Entre os métodos de visualização de dados, temos os gráficos de
barras, que estão entre os elementos visuais mais básicos e simples de
representar dados. Os gráficos de barras costumam ser utilizados para
comparação entre dados de várias categorias. Esses gráficos podem
ser apresentados em diferentes orientações (vertical ou horizontal)
e podem ser utilizados tanto para análises univariadas quanto para
multivariadas.
Neste capítulo, você vai estudar o conceito de gráfico de barras e ver
como diferenciá-lo de um histograma. Também vai ver como realizar
análises para a extração de insights e como elaborar gráficos de barras
para variáveis categóricas e numéricas usando a biblioteca Seaborn.
2 Gráficos de barras com Seaborn
Devido ao modo como nossos olhos comparam os pontos extremos relativos das
barras, é importante que os gráficos de barras sempre tenham uma linha de base zero
(em que o eixo x cruza o eixo y em zero); caso contrário, você obterá uma comparação
visual falsa (KNAFLIC, 2015). Veja no exemplo a seguir.
Gráficos de cascata
Um gráfico de cascata pode ser usado para dividir as partes de um gráfico
de barras empilhadas, com a finalidade de focar em apenas uma parte por
vez ou para mostrar um ponto de partida, aumentos ou reduções e o ponto
final resultante (KNAFLIC, 2015). Considere o seguinte exemplo de uso do
gráfico de cascata: uma empresa comercial de RH gostaria entender e avisar
aos seus clientes como o número de funcionários mudou durante o último
ano. A Figura 4 ilustra um gráfico de cascata que representa esse cenário:
no lado esquerdo do gráfico temos o número de funcionários no início do
ano; movimentando da esquerda para direita, temos a quantidade de adições
e reduções no quadro de funcionários; e na última coluna temos a quantidade
de funcionários no fim do ano.
Muitas vezes, os gráficos de barras não são usados por serem gráficos comuns.
No entanto, isso é um erro — justamente por serem comuns eles devem ser usados,
pois, em vez de gastar muito tempo tentando aprender a ler o gráfico, as atenções
do leitor podem ser voltadas para as formações que devem ser extraídas do gráfico
(KNAFLIC, 2015).
Uma distribuição discreta é baseada em valores do tipo inteiro, por isso um gráfico
em barras pode ser lido como um histograma para este tipo de situação dos dados
numéricos.
Gráficos de barras com Seaborn 11
(a)
(b)
Figura 11. Plotagem em barra vertical (a) e horizontal (b) dos dados sobre
o acidente do Titanic.
Gráficos de barras com Seaborn 13