Você está na página 1de 2

Cheatsheets / Aprenda análise de dados com Pandas

Introdução aos Pandas


Criação do Pandas DataFrame
O objeto Pandas fundamental é chamado de
DataFrame. É uma estrutura de dados tabular # Ways of creating a Pandas DataFrame
bidimensional mutável em tamanho, potencialmente # Passing in a dictionary:
heterogênea. data = {'name':['Anthony', 'Maria'], 'age':
Um DataFrame pode ser criado de várias maneiras. Ele
[30, 28]}
pode ser criado passando um dicionário ou uma lista
df = pd.DataFrame(data)
de listas para o pd.DataFrame() método ou lendo os
dados de um arquivo CSV.
# Passing in a list of lists:
data = [['Tom', 20], ['Jack', 30], ['Meera',
25]]
df = pd.DataFrame(data, columns = ['Name',
'Age'])

# Reading data from a csv file:


df = pd.read_csv('students.csv')

Pandas
Pandas é uma biblioteca de código aberto usada para
analisar dados em Python. Ele recebe dados, como um import pandas as pd
banco de dados CSV ou SQL, e cria um objeto com
linhas e colunas denominado quadro de dados. Pandas
é normalmente importado com o alias pd .

Seleção de linhas do Pandas DataFrame usando operadores lógicos


Nos pandas, linhas especí cas podem ser selecionadas
se satis zerem certas condições usando os operadores # Selecting rows where age is over 20
lógicos do Python. O resultado é um DataFrame que é df[df.age > 20]
um subconjunto do DataFrame original.
Múltiplas condições lógicas podem ser combinadas # Selecting rows where name is not John
com OR (usando | ) e AND (usando & ), e cada
df[df.name != "John"]
condição deve ser colocada entre parênteses.

# Selecting rows where age is less than 10


# OR greater than 70
df[(df.age < 10) | (df.age > 70)]
Função Pandas apply ()
A apply() função Pandas pode ser usada para aplicar
uma função a cada valor em uma coluna ou linha de um # This function doubles the input value
DataFrame e transformar essa coluna ou linha nos def double(x):
valores resultantes.   return 2*x
Por padrão, ele aplicará uma função a todos os valores
de uma coluna. Em vez disso, para executá-lo em uma
# Apply this function to double every value
linha, você pode especi car o argumento axis=1 na
in a specified column
apply() chamada da função.
df.column1 = df.column1.apply(double)

# Lambda functions can also be supplied to


`apply()`
df.column2 = df.column2.apply(lambda x : 3*x)

# Applying to a row requires it to be called


on the entire DataFrame
df['newColumn'] = df.apply(lambda row:
  row['column1'] * 1.5 + row['column2'],
  axis=1
)

Pandas DataFrames adicionando colunas


Pandas DataFrames allow for the addition of columns
after the DataFrame has already been created, by using # Specifying each value in the new column:
the format df['newColumn'] and setting it equal to the df['newColumn'] = [1, 2, 3, 4]
new column’s value.

# Setting each row in the new column to the


same value:
df['newColumn'] = 1

# Creating a new column by doing a 


# calculation on an existing column:
df['newColumn'] = df['oldColumn'] * 5

Você também pode gostar