Escolar Documentos
Profissional Documentos
Cultura Documentos
relevância do
automação para lidar com grandes bibliotecas disponíveis ajudam o
volumes de dados, é importante que profissional a fazer a aplicação,
o processamento aconteça de forma conduzir os processos analíticos e
eficiente e ágil. Além disso, também garantir que haja qualidade em cada
a análise de
É aí que entra o Python: a ferramenta desenvolvimento profissional com
prioriza a automação de tarefas, relação ao Python? Para contribuir
apresenta facilidade para lidar com com os próximos passos na sua
recorrências e possui certo grau de jornada profissional, preparamos um
Boa leitura!
1 Quais são as bibliotecas
mais utilizadas para
análise de dados?
neste e-book?
dados em um gráfico
4 Quer se desenvolver em
Python? Saiba como (+
dicas de livros)
5 Encerramento
Quais são as
bibliotecas mais
utilizadas para
análise de dados?
As libraries são o diferencial para que Python
seja uma boa escolha para a análise de
dados. Com elas, é possível obter soluções
completas para que as tarefas sejam realizadas
com sucesso. Saiba mais sobre as principais
bibliotecas a seguir:
#1 - Pandas
A primeira ferramenta da lista se destaca por atuar com análise
e manipulação de dados com facilidade, agilidade e flexibilidade.
Essas características tornam a análise produtiva e proporcionam
um alto desempenho, ajudando a destacar o Python na sua
função de atuar com o processamento dessas informações.
#2 - NumPy
1 Método superior de
armazenamento e
manipulação de dados
2 Libraries de linguagens
de níveis mais baixos
podem ler e alterar os
numéricos em comparação dados armazenados
às estruturas nativas de nesses arrays.
Python;
#3 - Matplotlib
1 projeções
cartográficas;
2 gráficos 3
tridimensionais;
mais produtos
gráficos.
TensorFlow e Keras
ainda existem Seaborn
Foco em Redes neurais, otimização
as seguintes
visualização de e modelos mais complexos
dados; de machine learning.
alternativas:
As funções que vamos destacar
a seguir podem ser utilizadas no
database Iris. O dataset apresenta
quatro variáveis de 50 amostras de três
espécies: setosa, versicolor e virginica.
1
/pd.read_csv
A função é indicada para realizar a leitura do
arquivo. O dataset é carregado para a memória,
além de ser mantido na variável “planta”.
2
/import
Essa instrução diz respeito à biblioteca
que será utilizada no código. Então,
vamos supor que pandas seja a nossa
primeira escolha. Veja:
Outro ponto é o estilo do gráfico, que
pode ser utilizado da seguinte forma:
3
base de dados. Caso o usuário não informe um
valor, a função exibirá até a 5ª linha.
/head()
4
dados que podem ser aproveitados para a
geração de estatísticas, como desvio padrão
/describe() e média.
5
/dtypes
6
de linhas e colunas da tabela.
/shape
7
entendimento dessa base de informações tornam-se
facilitados.
1
uma linha de
código, cinco
argumentos
2
no pacote de criação do essentials: type, most
unique values, frequent
pandas profiling missing values pandas values
profiling
descriptive
statistics correlations
Como fazer a instalação?
quantile
pip install pandas-profiling
statistics
ou
conda install -c anaconda pandas-profiling
pandas
#importing os pacotes necessários
import pandas as pd
profiling
import pandas_profiling
Como usar?
Utilize o conjunto de dados titânico para #Pandas-Profiling 2.0.0
A função amplia o DataFrame para uma apresentar os recursos do criador de df = pd.read_csv(‘titanic/train.csv’)
perfil Python. df.profile_report()
ágil análise de dados. Uma linha de código
gera volume de informações, além de um
relatório HTML interativo.
Essa linha cumpre com o objetivo de exibir o relatório de criação de perfil
de dados em um Jupyter Notebook de forma detalhada e com gráficos.
df.describe()df.info()functionsdf.profile_report()
Para exportar o relatório
para um arquivo HTML profile = df.profile_report(title=’Pandas Profiling Report’)
interativo, utilize o profile.to_file(outputfile=”Titanic data profiling.html”)
8 dicas para visualizar dados em um gráfico código:
Como usar?
#importar pandas
3
importar pandas como pd
Como fazer a instalação?
#importar plotly e abotoaduras no modo offline
pip install plotly # Plotly é um
importar abotoaduras como cf
pré-requisito antes de
instalar abotoaduras import plotly.offline
pip install abotoaduras cf.go_offline()
cf.set_config_file(offline=False, world_readable=True)
Plotar com
interatividade
sem modificar o
código de forma
brusca? É possível
Com a library Cufflinks, você
pode utilizar a plotagem unida
à flexibilidade dos pandas e
gerar gráficos. Veja:
4
desafios que aparecem na análise de dados. Ao utiliza
%lsmagic
você pode conferir todas as funções disponíveis.
Comandos
mágicos
Com a library Cufflinks, você
pode utilizar a plotagem unida
à flexibilidade dos pandas e
gerar gráficos. Veja:
Como
melhorar a
estética das
estruturas
de dados?
8 dicas para visualizar dados em um gráfico
Caixa azul para transmitir informações
6
<div class=”alert alert-block alert-info”>
<b>Dica:</b> Use caixas azuis (alert-info) para dicas e notas.
Se for uma nota, você não precisa incluir a palavra “Nota”.
</div>
Quer dar
destaque Caixa amarela para emitir avisos
a algo
<div class=”alert alert-block alert-warning”>
<b>Exemplo:</b> Caixas amarelas são geralmente usadas para
célula por
engano?
Saiba como
restaurar
8 dicas para visualizar dados em um gráfico
Com o Python, você pode importar,
transformar e visualizar dados na
8
ferramenta. Veja algumas ações:
1. 2.
Utilizando para clustering, podemos Após, vamos aplicar o agrupamento
usar a Análise de Componentes k-means para identificar grupos
Principais para diminuir as homogêneos nos dados.
como usar Obs.: crie scripts autônomos do código para testar e depurar
Python no
possíveis problemas antes de utilizá-los no Power BI.
1. 2.
Configure o ambiente Para gerenciar o ambiente Python, é possível
com as bibliotecas; utilizar virtualenv e pipenv ou a distribuição conda.
8 dicas para visualizar dados em um gráfico
Quer se desenvolver
em Python? Saiba Estatística/álgebra linear: são skills fundamentais para a realização
4 dicas de 3. 4.
livros para você Pense em Python: Pense Como
um Cientista da Computação -
Mãos à Obra: Aprendizado de
Máquina com Scikit-Learn &
ir além no seu Allen B. Downey - Novatec Editora TensorFlow - Aurélien Géron - Alta
Books
conhecimento
de Python Esperamos que os conteúdos Por isso, desejamos que a sua jornada
apresentados neste e-book possam com Python seja de muito aprendizado
contribuir com o desenvolvimento e evolução constante! Quer inovar com
da sua carreira e no aprimoramento a gente? Acesse o banco de talentos
das habilidades técnicas que, assim Vivo clicando aqui e venha digitalizar
como as soft skills, são importantes para aproximar.
para quem deseja alcançar maior
reconhecimento profissional ou até
mesmo um cargo de gestão.
E não deixe de nos acompanhar nas mídias sociais
Até a próxima!