Você está na página 1de 9

Profissão: Cientista de

Dados

11
BOAS
PRÁTICAS
Agregações e
operações em Conheça as agregações em Python

grupos Conheça o método aggregate

Conheça o método apply do groupby

Conheça o método mapping

Utilize tabela pivô

3
Conheça as A visualização de dados é Além das médias,

agregações uma parte crucial da análise


de dados. A biblioteca
experimente outras métricas e
análises relevantes para obter

em Python Matplotlib permite criar uma


variedade de gráficos e
uma visão mais completa dos
dados, como análise de
gráficos para ajudar a frequência e comparação de
entender os dados. Use-a categorias.
para visualizar dados
agrupados e identificar
Utilize gráficos temporais
tendências ao longo do
para visualizar tendências
tempo.
ao longo do tempo, como a
variação da média de idade
das mães em diferentes
datas de nascimento.

4
Conheça o Ao usar o método Você pode passar uma

método aggregate em Python, é


importante lembrar que
função definida pelo usuário
para o método aggregate.

aggregate ele pode ser usado de


duas maneiras:
Isso permite que você
personalize o processamento
escrevendo 'aggregate' dos seus dados de acordo
por extenso ou usando a com suas necessidades
abreviação 'AGG'. Ambas específicas.
as formas são aceitáveis,
mas é importante ser É possível passar uma lista
consistente em seu uso de funções para o método
para evitar confusão. aggregate e obter o
resultado para cada uma
dessas funções. Isso pode
ser útil para realizar várias
operações ao mesmo
tempo.
5
Conheça o
método apply
do groupby Lembre-se de que você Ao usar o método 'apply',
pode passar argumentos esteja ciente de que ele
adicionais para as funções retorna um novo objeto
que você aplica aos seus DataFrame ou Series. Se
dados. Isso pode ser útil você quiser manter as
para alterar o alterações em seu
comportamento da função DataFrame original, você
dependendo do contexto. precisará atribuir o
resultado de volta a ele.

6
Conheça o Ao criar novos grupos com Ao agrupar dados com

método base em uma variável


específica, como a
base em uma variável
geográfica, como

mapping escolaridade da mãe,


certifique-se de definir
municípios, crie um
dicionário para definir
claramente as categorias e quais unidades pertencem
usar um dicionário para a cada grupo.
mapear as novas
categorias. Lembre-se de que o
mapeamento é uma
ferramenta poderosa para
Ao mapear uma coluna,
transformar e categorizar
defina-a como índice
dados, tornando-os mais
para facilitar o processo.
úteis para análises
subsequentes.

7
Utilize tabela Ao criar variáveis
categóricas a partir de
A função qcut é uma
alternativa à função cut

pivô variáveis numéricas,


considere o uso da função
quando você deseja criar
faixas baseadas em
cut do pandas. Esta função quantis, em vez de valores
permite criar faixas de fixos. Isso pode ser útil
valores que podem ser quando você deseja dividir
úteis para agrupar os seus dados em grupos de
dados de maneira mais tamanhos iguais.
significativa.
Você também pode aplicar
Ao renomear as colunas diferentes funções de
resultantes em uma tabela agregação a diferentes
pivô, você pode passar uma colunas, passando um
tupla para 'aggfunc' em vez dicionário para 'aggfunc'.
de uma única função ou Isso permite que você
lista de funções. Isso pode personalize ainda mais a
tornar seus resultados mais maneira como seus dados
fáceis de entender. são resumidos. 8
Bons estudos!

Você também pode gostar