Você está na página 1de 5

 

 
Nanodegree Data Scientist  
Machine Learning, Big Data e Habilidades de Engenheiro de 
Software   
 

Antes de começarmos 
Agradecemos  de  antemão  o  seu  interesse  no  programa  Nanodegree  Data  Scientist.  Para  que  aproveite  ao 
máximo  o  conteúdo  disponível,  recomendamos  que  você  reserve  de  8  a  10  horas  por  semana  para  se 
dedicar  ao  curso.  Além  disso,  você  precisará  de um computador com sistema operacional Mac ou Windows 
para a instalação de Python e bibliotecas adicionais.  
Esse  curso  tem  duração  de  6  meses  considerando  de  8  a  10 horas por semana. Se não conseguir terminar 
nesse  tempo  você  terá  direito  a  uma  transferência  de  turma  desde  que  informe  durante  a  vigência  do 
curso. 
 
 

Módulo 1: Introdução ao Curso 


Conheça os instrutores e revise conceitos necessários para acompanhar o curso, como o uso de Pandas e 
Numpy.  
 
 

Conteúdo das aulas do módulo 1:  

Aula  Resultados do aprendizado 

Introdução à Data  ➔ Aprenda  conceitos  básicos de Data Science e revise bibliotecas e 


Science  conceitos importantes 

Revisão de Matrizes e  ➔ Revise como utilizar Numpy e Matrizes 


Numpy 
 

 
 
 
 

Módulo 2: Conceitos de Engenharia de Software  


Aprenda comandos fundamentais de Linux e a criar e utilizar controle de versão em seus projetos. 
 
 

Conteúdo das aulas do módulo 2:  

Aula  Resultados do aprendizado 

Linux Essencial  ➔​ Aprenda os comandos fundamentais do Linux 

O que é Controle de  ➔ Aprenda  o  que  é  e  por  quais  motivos  controle  de  versão  é 
Versão  essência no desenvolvimento de software 

Crie um repositório Git  ➔ Aprenda a criar um repositório Git 

Vendo o Histórico do Git  ➔ Aprenda como rastrear mudanças e autores em repositórios Git 

Fazendo Mudanças com  ➔ Aprenda a fazer mudanças rastreáveis com Git 


Git 

Tags, Branching e  ➔ Aprenda  a  criar  nomes  para  versões  e  gerenciar  ramos  em  um 
Merging  repositório 

Desfazendo Mudanças  ➔ Aprenda como desfazer mudanças realizadas  

Trabalhando com  ➔ Aprenda  a  trabalhar  com  repositórios  remotos,  importantes 


Repositórios Remotos  para o trabalho em equipe 

Trabalhando com outros  ➔ Aprenda  a  contribuir  com  a  comunidade  de  software  com  Pull 
Desenvolvedores  Requests e Forks 

 
  
  
 
 

 
 
 
 

Módulo 3: Big Data e Map Reduce 


Aprenda conceitos de big data e Map Reduce, bem como boas práticas. Por fim, você colocará em prática os 
conhecimentos adquiridos em um projeto de análise dos dados do metrô da cidade de Nova York. 

Conteúdo das aulas do módulo 3:  

Aula  Resultados do aprendizado 

Big Data  ➔​   Aprenda o que é Big Data, sua motivação e a proposta do 
ecossistema Hadoop

HDFS e MapReduce  ➔ Aprenda os conceitos básicos de HDFS, MapReduce e Hadoop 

Código do MapReduce  ➔ Aprenda a escrever seus próprios códigos MapReduce 

Padrões de Design para  ➔ Aprenda padrões de design e boas práticas de MapReduce 


MapReduce 

Projeto: Analisando  ➔ Utilize o que foi aprendido para analisar dados do metrô de NY 
dados do Metrô de NY 
 
 

Módulo 4: Programação em R 
Aprenda conceitos básicos de programação em R e acompanhe entrevistas com especialistas do Netflix 
sobre a importância da linguagem.  

Conteúdo das aulas do módulo 4:  


 
Aula  Resultados do aprendizado 

Linguagem de  ➔  Aprenda os comandos essenciais do R e como utilizar estruturas 


Programação R  condicionais, funções e repetições 

Laboratório de R  ➔ Teste  os  conhecimentos  com  desafios  de  programação 


utilizando R 

 
 
 
 

Módulo 5: Aprendizagem Supervisionada 


Aprenda a como utilizar diferentes técnicas de aprendizagem supervisionada para criar modelos preditivos 
poderosos com base em dados anotados.  
 

Conteúdo das aulas do módulo 5:  

Aula  Resultados do aprendizado 

Introdução a  ➔  Aprenda o que é aprendizagem supervisionada e quais são suas 
Aprendizagem  aplicações 
Supervisionada 

Introdução à Regressão  ➔ Aprenda  como  modelar  um  conjunto  de  dados  utilizando 
regressão e classificação 

Regressões em  ➔ Aprenda  a  utilizar  modelos  de  regressão  com  a  biblioteca 


Scikit-Learn  scikit-learn 

Árvores de Decisão  ➔ Aprenda  o  que  são  e  como  utilizar  árvores  de  decisão  em 
modelos supervisionados 

Redes Neurais Artificiais  ➔ Aprenda o que são e como utilizar redes neurais artificiais 

Máquinas de Vetor  ➔ Aprenda  o  que  são  e  como  utilizar  Máquinas  de  Vetor  Suporte, 
Suporte (SVM)  um poderoso algoritmo de aprendizagem supervisionada 

Métodos Bayesianos  ➔ Aprenda  como  utilizar  regra  de  Bayes  para  modelos 
supervisionados 

Modelos de  ➔ Aprenda  a  utilizar  modelos de classificação por agrupamento de 


Agrupamento   classificadores 

Projeto: Achando  ➔ Com  quase  15  milhões  de  trabalhadores  na  Califórnia,  a 
doadores para Caridade  CharityML  pediu  sua  ajuda  na  criação  de  um  algoritmo  que 
melhor  identifique  potenciais  doadores  e  reduza  o  custo  com 
envio  de  cartas.  Seu  objetivo  será  avaliar  e  otimizar  vários 
agentes  de  aprendizagem  supervisionada  para  determinar  qual 
algoritmo  levará  ao  maior  rendimento  com  doações,  ao mesmo 
tempo  em  que  reduz  também  o  número  total  de  cartas 
enviadas. 
 
 

 
 
 
 

Módulo 6: Aprendizagem Não Supervisionada 


Aprenda a como utilizar diferentes técnicas de aprendizagem supervisionada para criar modelos preditivos 
poderosos com base em dados anotados.  
 

Conteúdo das aulas do módulo 5:  

Aula  Resultados do aprendizado 

Introdução a  ➔  Aprenda  o  que  é  aprendizagem não supervisionada e quais são 


Aprendizagem Não  suas aplicações 
Supervisionada 

Agrupamento  ➔ Aprenda  técnicas  de  aprendizagem  não  supervisionada,  como 


(Clustering)  K-means 

Dimensionamento de  ➔ Aprenda  técnicas  de  pré-processamento  vitais  para 


Atributos  aprendizagem não supervisionada 

Seleção de Atributos  ➔ Aprenda  a  utilizar  técnicas  para  selecionar  atributos  que 


explicam tendências dos dados 

Análise de Componentes  ➔ Aprenda  a  utilizar  o  método  de  Análise  de  Componentes 


Principais (PCA)  Principais  para  reduzir  o  número  de  variáveis  no  conjunto  de 
dados sem perder informação 

Transformação de  ➔ Aprenda diversos métodos de transformação de atributos 


Atributos 

Projeto: Criando  ➔ Um  distribuidor  recentemente  fez  uma  alteração  em  seu 
segmentos de  método  de  entrega,  quase  imediatamente,  ele  começou  a 
Consumidores  receber  queixas  sobre  a  mudança  e  diversos  clientes  estavam 
cancelando  o  serviço.  Você  foi  contratado  pelo distribuidor para 
usar  técnicas  de  aprendizado  não-supervisionado  sem 
supervisão  para  entender  os  diferentes  segmentos  de  clientes 
atendidos e a melhor solução de negócio para cada um deles. 
 
 
 
 
 
 
 
 
 

Você também pode gostar