Escolar Documentos
Profissional Documentos
Cultura Documentos
Conteúdo programático
1. Aprendizado supervisionado
Regressão e Classificação
Métricas de avaliação
Sobreajuste e Subajuste de modelos
Seleção de modelos: Erro de Generalização; Validação Cruzada; Conjuntos de Treino,
Validação e Teste
Trade off entre Variância e Viés
Algoritmos
o Regressão Linear e Regressão Logística
o Árvores de decisão
o Máquina de vetores de suporte
o Naive Bayes
o k-NN
o Ensembles
http://www.petrobras.com.br/pt/
Elaborado em 2 de julho de 2019 pelo GT da
Certificação de Conhecimento em Ciência de
Dados (instituído pelo DIP GP/CE/UP
000006/2019)
5. Probabilidade e estatística
7. Big Data
Ecossistema Hadoop
o Núcleo (HDFS, MapReduce, YARN)
o Hive
o Sqoop
o Zookeeper
o Spark
http://www.petrobras.com.br/pt/
Elaborado em 2 de julho de 2019 pelo GT da
Certificação de Conhecimento em Ciência de
Dados (instituído pelo DIP GP/CE/UP
000006/2019)
Derivadas
Máximos e Mínimos
Esboços de Gráficos de Funções
Integrais
Modelo entidade-relacionamento
Mapeamento lógico relacional
Normalização
Linguagem de definição e manipulação de dados (SQL)
Conceitos de Data warehousing
Modelagem multidimensional (esquema estrela)
Processamento e otimizaçâo de consultas
Bancos NoSQL
Referencial Bibliográfico
http://www.petrobras.com.br/pt/
Elaborado em 2 de julho de 2019 pelo GT da
Certificação de Conhecimento em Ciência de
Dados (instituído pelo DIP GP/CE/UP
000006/2019)
Kevin Patrick Murphy. Machine Learning: a Probabilistic Perspective. MIT Press, 2012.
Ian Goodfellow, Yoshua Bengio, Aaron Courville. Deep Learning. MIT Press, 2016.
Jake VanderPlas. Python Data Science Handbook: Essential Tools for Working with Data.
O'Reilly Media, 2016.
Item acima ou, equivalentemente, o abaixo:
Hadley Wickham, Garrett Grolemund. R for Data Science: Import, Tidy, Transform,
Visualize, and Model Data. O'Reilly Media, 2016.
Steven Bird, Ewan Klein, Edward Loper. Natural Language Processing with Python.
O'Reilly Media, 2016.
Item acima ou, equivalentemente, o abaixo:
Julia Silge, David Robinson. Text Mining with R: A Tidy Approach. O'Reilly Media, 2017.
Bill Chambers, Matei Zaharia. Spark: The Definitive Guide. O'Reilly Media, 2018.
Iaci Malta, Sinésio Pesco, Hélio Lopes. Cálculo a Uma Variável – Volumes 1 e 2. Elsevier,
2015.
David Poole. Álgebra Linear - Uma Introdução Moderna. Cengage Learning, 2016.
http://www.petrobras.com.br/pt/
Elaborado em 2 de julho de 2019 pelo GT da
Certificação de Conhecimento em Ciência de
Dados (instituído pelo DIP GP/CE/UP
000006/2019)
Lilian Markenzon, Jayme Luiz Szwarcfiter. Estruturas de Dados e Seus Algoritmos. LTC,
2010.
http://www.petrobras.com.br/pt/