Escolar Documentos
Profissional Documentos
Cultura Documentos
1. Aprendizado supervisionado
Regressão e Classificação
Métricas de avaliação
Sobreajuste e Subajuste de modelos
Seleção de modelos: Erro de Generalização; Validação Cruzada; Conjuntos de Treino,
Validação e Teste
Trade off entre Variância e Viés
Algoritmos o Regressão Linear e Regressão Logística o Árvores de decisão o Máquina
de vetores de suporte o Naive Bayes o k-NN o Ensembles
5. Probabilidade e estatística
Conceitos de Probabilidade: Modelo de probabilidade, Probabilidade Condicional,
Independência, Variáveis Aleatórias, Variância e Covariância
Distribuições Contínuas e Discretas: Normal, t-Student, Poisson, Exponencial, Binomial,
Dirichlet.
Estatísticas Descritivas
Inferência Estatística: Teorema do Limite Central, Teste de Hipótese e Intervalo de
Confiança, Estimador de Máxima Verossimilhança, Inferência Bayesiana
7. Big Data
Ecossistema Hadoop
o Núcleo (HDFS, MapReduce, YARN)
o Hive
o Sqoop
o Zookeeper
o Spark
Referencial Bibliográfico
I. Kevin Patrick Murphy. Machine Learning: a Probabilistic Perspective. MIT Press, 2012.
II. Christopher M. Bishop. Pattern Recognition and Machine Learning. Springer, 2011.
III. Ian Goodfellow, Yoshua Bengio, Aaron Courville. Deep Learning. MIT Press, 2016.
IV. Jake VanderPlas. Python Data Science Handbook: Essential Tools for Working with
Data. O'Reilly Media, 2016. Item acima ou, equivalentemente, o abaixo: Hadley
Wickham, Garrett Grolemund. R for Data Science: Import, Tidy, Transform, Visualize,
and Model Data. O'Reilly Media, 2016.
V. Sam K. Kachigan. Statistical Analysis: An Interdisciplinary Introduction to Univariate &
Multivariate Methods. Radius Press, 1986.
VI. Athanasios Papoulis, S. Unnikrishna Pillai. Probability, Random Variables and Stochastic
Processes. McGraw-Hill, 2002.
VII. Douglas C. Montgomery, George C. Runger. Applied Statistics and Probability for
Engineers. Wiley, 2014.
VIII. Steven Bird, Ewan Klein, Edward Loper. Natural Language Processing with Python.
O'Reilly Media, 2016. Item acima ou, equivalentemente, o abaixo: Julia Silge, David
Robinson. Text Mining with R: A Tidy Approach. O'Reilly Media, 2017.
IX. Tom White. Hadoop: The Definitive Guide. O'Reilly Media, 2015.
X. Bill Chambers, Matei Zaharia. Spark: The Definitive Guide. O'Reilly Media, 2018.
XI. Louis Leithold. O Cálculo Com Geometria Analítica – Volume 1. Harbra, 1994.
XII. Iaci Malta, Sinésio Pesco, Hélio Lopes. Cálculo a Uma Variável – Volumes 1 e 2.
Elsevier, 2015.
XIII. David Poole. Álgebra Linear - Uma Introdução Moderna. Cengage Learning, 2016.
XIV. Gilbert Strang. Álgebra linear e suas aplicações. Cengage Learning, 2010.
XV. C. J. Date. Projeto de Banco de Dados e Teoria Relacional. O'Reilly / Novatec, 2015.
XVI. Ramez Elmasri, Shamkant B. Navathe. Sistemas de Banco de Dados. Pearson, 2010.
XVII. Pedro A. Morettin, Clélia M. C. Toloi. Análise de Séries Temporais. Blucher, 2018.
XVIII. Lilian Markenzon, Jayme Luiz Szwarcfiter. Estruturas de Dados e Seus Algoritmos. LTC,
2010.