Escolar Documentos
Profissional Documentos
Cultura Documentos
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import colorsys
plt.style.use('seaborn-talk')
import warnings
warnings.filterwarnings('ignore')
%matplotlib inline
2 – CARREGANDO ARQUIVO
3 – DESCREVENDO ARQUIVO
BASE.dtypes;
Dtypes – comando utilizado para exibir o nome e o tipo de cada uma das colunas.
BASE.describe();
describe() – comando utilizado para descrever as principais caracteristicas dos dados.
3.3 – VERIFICANDO A QUANTIDADE DE DADOS POR COLUNA
BASE.info();
Info() – comando utilizado para verificar se há dados faltando em uma variavel.
3.4 – VERIFICANDO O TAMANHO DO ARQUIVO
BASE.shape;
shape – comando utilizado para verificar a quantidade de linhas e colunas.
4 – EXIBINDO AS PRIMEIRAS LINHAS DA BASE CARREGADA
BASE.head(5);
Head() – comando utilizado para exibir as primeiras linhas, entre parênteses
especificar a quantidade de linhas que se deseja exibir.
BASE[‘NOME COLUNA’].unique();
unique() – comando utilizado para exibir os valores unicos de uma variavel.
Para criar sub conjuntos em um base, temos que colocar as colunas desejadas dessa
base entre chaves[] conforme sintaxe acima.
Símbolos:
== atribuição
!= diferente
& simbo e
Exemplo: hospital_base[hospital_base['PROCEDIMENTO'].str.contains('AMPUTA')]
8 – AGRUPANDO DADOS
1)BASE.groupby(['COD_BENEFIC', 'DAT_INTERNACAO_INTERN', 'DAT_ALTA_INTERN']).sum().sort_values('VAL_ITEM_PAGO',
ascending = False) ;
2)BASE[[“COL1”, “COL2”]].groupby([“COL1”]).sum();
Para agrupar dados usar o comando groupby conforme sintaxe acima, nesse comando
usar expressão de agrupamento (sum, max, min, entre outros) mais a função sort_values para
especificar a variável de agrupamento.
9 – ORDENANDO DADOS
Em muitos casos há a necessidade de ordenar uma variável, para isso o python usa o
comando sort_values, conforme sintaxe abaixo.
df.sort_values(['col_A', 'col_B']).
Para unificar bases de dados o python usa as funções merge, join, append ou concat. A
função concat unifica as bases sem precisar de uma coluna chave, abaixo a sintaxe:
A) Concat
B) Merge
A função merge é a mais indicada para ocasiões que necessitam de uma ou mais
chaves, abaixo alguns exemplos com a utilização de chaves.
Sintaxe:
Obs: Caso as colunas chaves não possuírem o mesmo nome usar a sintaxe abaixo:
Obs: usar uma das notações (left|right|inner|outer) para unir as bases que se deseja.
C) Join
A função join também indicada para ocasiões que necessitam de uma ou mais chaves,
abaixo alguns exemplos com a utilização de chaves.
Sintaxe:
Base_A.join(Base_B, how="left|right|inner|outer” );
D) Append
A função append unifica duas ou mais bases desde que as bases tenham as mesmas
colunas.
Sintaxe:
Base_A.append(Base_B, ignore_index=True).
13 – CONDIÇÕES
12.1 – IF
12.2
14 – GRAFICOS