Escolar Documentos
Profissional Documentos
Cultura Documentos
Python é uma linguagem de programação interpretada, de alto nível e de propósito geral. Seu criador, Guido van Rossum,
enfatizou legibilidade de código e sua abordagem de orientação a objetos permite que projetos de diversos tamanhos sejam
desenvolvidos usando código simples, lógico e fácil de entender, devido a sua sintaxe clara. Além da orientação a objetos,
Python também oferece suporte a outros paradigmas de programação, como programação estruturada e programação
funcional.
A filosofia central da linguagem foi resumida no documento The Zen of Python (PEP 20) [1], que inclui frases como:
Python é visualmente mais “limpa” do que outras linguagens, além de ser mais intuitiva, pois frequentemente usa palavras da
língua inglesa onde outras linguagens usariam pontuações. O nome da linguagem é um tributo ao grupo de comédia britânico
Monty Python, o que inspirou os desenvolvedores a fazer com que a linguagem seja divertida de usar. Essa abordagem de
desenvolvimento inspirou a criação do neologismo “pythonico”, que quer dizer que o código é natural e está de acordo com a
filosofia minimalita e de ênfase na legibilidade. Por outro lado, códigos difíceis de entender or ler são chamados de não-
pythonicos. Usuários e admiradores de Python, sobretudo aqueles considerados mais experientes costumam er chamados de
Pythonistas.
16.00% Tag
c#
14.00% python
% de perguntas no Stack Overflow no mês
javascript
java
12.00% php
c++
r
10.00%
8.00%
6.00%
4.00%
2.00%
0.00%
2009 2010 2011 2012 2013 2014 2015 2016 2017 2018 2019
Ano
Esse crescimento do interesse por Python extremamente acentuado a partir de 2012 está conectado ao avanço da área de
ciência de dados e conhecimentos relacionados, como aprendizagem de máquina, big data, business analytics, entre outras.
Python e R costumam ser as linguagens mais citadas por cientistas de dados em seus perfis em redes sociais como LinkedIn.
Segundo análise da Initiative for Analytics and Data Science Standards (IADSS) [3], 100% dos cientistas de dados mencionam
https://tmfilho.github.io/pyestbook/intro.html 1/2
11/03/22, 07:58 Python para Estatísticos — Python para Estatísticos
conhecimento de Python em seus perfis, enquanto 84% mencionam R. Além disso, como mostra a Fig. 2, o mercado de
trabalho abraçou essas duas linguagens, com mais de 70% dos anúncios de vagas para cientistas de dados, retirados de sites
como LinkedIn, Indeed, SimplyHired e Monster em outubro de 2018, mencionando Python e mais de 60% mencionando R.
Fig. 2 20 habilidades mais mencionadas em anúncios de vagas para cientistas de dados [4].
Para completar esta motivação, geramos a tabela abaixo usando Python e a biblioteca pandas, dando um gostinho do que vem
por aí. Os dados foram obtidos por meio da plataforma Google Trends e representam o interesse mundial por quatro tópicos
de buscas no Google: Python, R, aprendizagem de máquina e ciência de dados. A quantidade de buscas de cada tópico foi
medida semanalmente. O código abaixo calcula o índice de correlação de Spearman do interesse semanal de cada um dos
tópicos e todos os outros. Os valores calculados indicam que há relação entre o crescimento do interesse em ciência de dados
e aprendizagem de máquina e a quantidade de buscas relacionadas a R e Python. Esta última apresentou correlações quase
perfeitas com ciência de dados e aprendizagem de máquina, mostrando que o seu crescimento nos últimos 5 anos está
diretamente conectado ao crescimento da importância dessas áreas.
import pandas as pd
url = 'https://tmfilho.github.io/pyestbook/data/google-trends-timeline.csv'
trends.corr(method='spearman')
O código abaixo gera um gráfico com as quatro séries temporais de interesse. Os valores são relativos ao maior valor de
interesse no período, que nesse caso equivale ao interesse por Python em setembro de 2019.
plot = trends.plot()
plt.xlabel('Semana', fontsize=16)
plt.show()
© Copyright 2021.
https://tmfilho.github.io/pyestbook/intro.html 2/2