Você está na página 1de 4

@Odemir Depieri Jr Compartilhe

Trilha para
Cientista de Dados
Conhecimento: Informações:

Tempo Médio 12 meses

Salário Médio R$ 5.5 mil

Apaixonado por Dados


Negócio

Curioso pelo Negócio

Pauta pata estudar:

Módulo 1 - Introdução à Ciência de Dados


1. Introdução ao tema da à ciência de dados

Módulo 2 - Linguagem de Programação ( R ou Python )


1. Variáveis
2. Operadores
3. Estrutura básica de dados
4. Loop de Repetições
5. Estrutura de condições
6. Métodos de Funções
7. Uso de Bibliotecas
8. Tratamento de Erro

Módulo 3 - Banco de Dados (SQL)


1. Introdução à banco de dados
2. Consultas em geral
3. Manipulação de dados
4. JOIN
5. Funções
6. Querys

Módulo 4 - Bibliotecas para Modelagem de Dados


1. Biblioteca para Modelagem de Dados
a) Python ( Pandas, Numpy )
b) R ( data.table, plyr, MissForest, MissMDA, Outliers )

Módulo 5 - Data Visualization


1. Biblioteca para visualização de dados ( Análise Gráfica )
a) Python ( Matplotlib, Seaborn )
b) R ( ggplot2, googlevis )
@Odemir Depieri Jr Compartilhe

Módulo 6 - Estatística

1. Estatística Descritiva Univariada


o Média, Moda, Mediana.

2. Medidas de Dispersão
o Amplitude, Desvio-Médio, Variância, Desvio-padrão, Erro-padrão.

3. Medidas de Assimetria e Curtose


4. Medidas de dispersão
o Amplitude, Desvio-Médio, Variância, Desvio-padrão, Erro-padrão.

5. Medidas de Associação entre Variáveis Quantitativa


o Diagrama de dispersão, Covariância, Correlação.

6. Probabilidade
o Experimente Aleatório, Espaço amostral, Eventos, Operações com eventos, Eventos
mutuamente excludentes, Eventos independentes, Probabilidade condicional, Teorema
de Bayes.

7. Variáveis Aleatórias e Distribuições de probabilidade


o Esperança Matemática (valor esperado ou expectância), Variância, Covariância,
Coeficiente de correlação, Desigualdade de Tchebychef, Momentos de uma
distribuição.

8. Distribuições discretas
o Distribuição de Bernoulli, Distribuição binomial, Distribuição binomial negativa,
Distribuição geométrica, Distribuição hipergeométrica, Distribuição de Poisson,
Distribuição de Pascal, Distribuição Multinominal.
9. Distribuições contínuas
o Distribuição uniforme, Distribuição normal (guassian distribution), Distribuição Log-
normal, Distribuição exponencial, Distribuição Gama, Distribuição qui-quadrado,
Distribuição t de Student, Distribuição F de Snedecor.
10. Distribuições de probabilidade conjunta
o Distribuição conjunta de variáveis discretas, Distribuição conjunta de variáveis
contínuas
11. Inferência Estatística e Principais Teoremas de Probabilidade
o Teorema de Tchebycheff, Lei dos grandes números, Teorema Central do Limite
o Estimadores ( Estimadores não viesados, Estimadores eficientes, Estimadores
consistentes, Melhor estimador linear não viesado, Propriedades ideais dos estimadores
em pequenas e grandes amostras, Estimação por máxima verossimilhança )
o Intervalo de confiança ( Intervalo de confiança para µ quando o valor de σ é
conhecido, Intervalo de confiança para µ quando o valor de σ é desconhecido, Intervalo
de confiança para uma proporção)
o Testes de hipóteses (Tipos de erro • Testes paramétricos • Testes não paramétricos

Livros para Estatística


o MEYER, P. L. Probabilidade – Aplicações à Estatística. São Paulo: Livros Técnicos e Científicos Editora, 1983.
o TOLEDO, G.L e OVALLE, I.I. Estatística Básica. São Paulo: Atlas, 1995.
o Kroese, Dirk P., Chan, Joshua C.C. Statistical Modeling and Computation. New York: Springer, Verlag, 2014
o CASELLA, G.; BERGER, R. L. Statistical Inference, Duxbury Press, 2001.
o HOGG, McKEAN J. W.; CRAIG, J. W. Introduction to mathematical statistics. 8th ed. 2019.
o HOFFMANN, R. Estatística para Economistas. São Paulo: Pioneira Thomson Learning, 2006.
o FÁVERO, L. P.; BELFIORE, P. Manual de análise de dados. Rio de Janeiro: Elsevier, 2017.
o MORETTIN, P. A.; TOLOI, C. M. C. Análise de séries temporais. São Paulo: Egard Blucher, 2006.
@Odemir Depieri Jr Compartilhe

Módulo 7 - Modelos de Regressão

1. Regressão Linear – Simples


2. Regressão Linear – Múltipla
3. Análise de Resíduos
4. Regularização L1 e L2
5. Modelos Lineares Generalizados
6. Regressão polinomial

Módulo 8 - Modelos de Classificação

1. Naives Bayes
2. Arvores de Decisão
3. KNN
4. Regressão Logística
5. SVM ( Maquinas de vetores de suporte )
6. Redes Neurais Artificiais

Módulo 9 - Modelos de Clusterização + Redução Dimensão

1. K-means
2. DBSCAN
3. PCA
4. LDA
5. Kernel PCA

Módulo 10 - Séries Temporal

1. Média Móvel
2. Suavização Exponencial Simples
3. Suavização Exponencial Simples e Amortecida
4. Holt Winters
5. Arima
6. Auto Arima

o Acurácia, F1 Score, Precisão, Recall, Matriz de Confusão, AUC - Area Under the ROC
Curve, Log Loss, Mean Squared Error – MSE, Mean Absolute Error – MAE, Mean Absolute
Percentage Error – MAPE, R2.
@Odemir Depieri Jr Compartilhe

Suporte - Onde encontrar material gratuito?

1. Playlist completa de Estatística básica da UFPR

2. Estatística e Probabilidade (Khan Academy)

3. Séries Temporais

4. Estatística e Econometria

5. Estatística Básica (Professor Guru)

6. Professor Grings

7. Estatística (Univesp)

8. Probabilidade e Estatística (Me Salva!)

9. Curso de Python

10. Curso de R

11. PlayList Python para Machine Learning

12. PlayList R para Machine Learning

13. Matemática para Machine Learning

14. Algoritmos de Machine Learning

15. Tutoriais para Python, R, SQL (W3schools)

16. Cursos disponível pela Kaggle

17. PlayList de SQL (Curso)

18. Introdução a redes neurais

19. PDFs de ajuda nos algoritmos

Produção Coprodução
Odemir Depieri Jr Ronisson Lucas
Data Intelligence Analyst Sr Consultor Data Science
Tech Lead Prof. Estatística
Specialization AI Doutorando

Você também pode gostar