Você está na página 1de 11

Bootcamp Engenheiro(a)

de Dados
EMENTA DO CURSO
Olá!
Neste Bootcamp você conhecerá
as técnicas e tecnologias usada na
construção do pipeline de dados (data
flow) que envolvem processos de
coleta, preparação, processamento,
armazenamento e acesso a dados.
Conteúdo
Bootcamp Engenheiro(a)

Sobre o IGTI 04

IGTI em números 05

Sobre o Bootcamp 06

Engenheiro(a) de Dados 07
de Dados

Módulos 08

Contato 11
4

Sobre o IGTI

O Instituto de Gestão e Tecnologia da Informação,


fundado em 2006, é uma instituição de ensino superior
credenciada pelo MEC. É referência nacional na formação
profissional em TI e Tecnologias Emergentes, e possui
um modelo educacional a distância que prioriza a
... IGTI é exemplo de programas a excelência acadêmica dos seus alunos.
distância (EAD)”...

Valor Econômico
Conecte-se com o futuro! Estude a distância
com aulas semanais por videoconferência.
5
O que estão falando sobre o IGTI?
O IGTI foi contemplado em 2020, pelo segundo ano
consecutivo, como uma das 3 empresas mais inovadoras no
IGTI em números uso da TI no Brasil pelo IT Forum, na categoria Educação.

Muitos são os motivos para investir no seu futuro profissional


através do IGTI.

85% de Satisfação 100% Interativo


Percentual de alunos que avaliam as As aulas semanais ao vivo permitem
suas disciplinas com 4 ou 5 estrelas. esclarecer dúvidas diretamente com
o professor.

98% de Satisfação 93% de Retenção


no Atendimento Taxa de alunos que concluem o
A educação do IGTI é centrada na curso muito superior à média de
experiência e satisfação do aluno. mercado para EAD.

Formação intensiva, prática e imersiva em habilidades


para atuação no mercado de tecnologia.
6

Sobre os Bootcamps

Benefícios Prático: Um programa de ensino focado nas habilidades


técnicas para atuar imediatamente no mercado de trabalho.
Domine as técnicas e ferramentas mais utilizadas no
mercado. Interativo: Aulas semanais por videoconferência para solução
de dúvidas, aprofundamento nos conteúdos, execução /
Adquira a experiência necessária ao mercado com correção de atividades práticas e orientações e debates sobre
aprendizado prático. os desafios propostos.

Garanta o acesso às melhores oportunidades de carreira. Informações Complementares

Metodologia
Carga horária 148 horas
Imersivo: Uma abordagem hands-on de alto impacto para
formar skills técnicos muito mais rápido que o ensino
Duração 2 meses
tradicional.
7

Bootcamp Engenheiro(a)
de Dados

Objetivo principal: • Conduza iniciativas envolvendo o planejamento de


soluções integradas.
O objetivo do Bootcamp é apresentar técnicas
e tecnologias usadas na construção do pipeline Pré-requisitos
de dados (data flow) que envolvem processos
de coleta, preparação, armazenamento e acesso • Conhecimento em banco de dados, modelagem,
a dados, além da integração e combinação de linguagem SQL, lógica de programação,
diferentes fontes de dados. programação orientada a objetos, linguagens de
programação (preferencialmente Python e R).
Objetivos específicos: • Inglês para leitura.
• Cartão de crédito para criação das contas free nas
• Aprenda a construir e automatizar seu pipeline plataformas em nuvem.
de dados.
8

Módulos

Aquecimento e Regras do Jogo • Fundamentos de modelagem de dados;


• Linguagem SQL;
• Visão geral da dinâmica do curso, • Visão geral dos processos de coleta,
conteúdos e ferramentas utilizadas. armazenamento e preparação de dados
• Exemplo prático de coleta, preparação e
Duração: 4 horas armazenamento de dados;
• Visão geral em Cloud computing.

1 Fundamentos Duração: 32 horas

• Conceitos fundamentais: Dados, fontes de


dados, Big Data, tipos de dados;
2 Coleta e Preparação de Dados
• Visão geral do pipeline de ciência
de dados: coleta, preparação, • Fundamentos da coleta de dados;
armazenamento, processamento/análise, • Particularidades dos processos aquisição,
visualização; extração, ingestão, coleta;
• Atividades de engenharia do Pipeline de • Coleta de dados em bases de dados (Relacional e
Dados; NoSQL);
9

• Coleta de dados via API (Twitter, site de • Preparação de dados para mineração de
notícias, dados governamentais); texto (n-gramas, remoção de stopwords e
• Coleta de dados via crawler e scraper normalização morfológica (stemming);
Manipulando dados desalinhados, • Estudos de caso;
inconsistentes e não padronizados;
• Transformação, limpeza, enriquecimento de Duração: 32 horas
dados;
• Integração de dados, Tratamento de dados
ausentes; 3 Novos Paradigmas em
• Categorização e discretização;
Armazenamento de Dados
• Técnicas de anonimização de dados
(LGPD);
• SGBDs SQL, NoSQL, NewSQL. ACID versus
• Combinando dados de múltiplas fontes;
Teorema CAP / BASE, Categorias de SGBD
• Normalização de Dados;
NoSQL, Tecnologias existentes;
• Transformação e transferência de dados;
• Sistemas de arquivo;
• Ferramentas para preparação de dados;
• Exemplos e práticas de preparação em
dados estruturados, semiestruturados e
não estruturados;
10

• Armazenamento de dados em • Visão geral de soluções para


nuvem: Conceitos de Data Lake, Data extração, ingestão, transformação,
Warehouse e Data Lakehouse; armazenamento e análise de dados;
• Soluções de Data Lake - AWS S3, • Fluxo de dados ETL/ELT;
GCS (Google Cloud) e Azure Blob • Implementação e automatização de
Storage; ETL/ELT;
• Soluções de DW - AWS Redshift, • Pipeline de Dados com Apache
Google Big Query e Azure SQL Airflow;
Datawarehouse; • Pipeline de Dados com Apache Nifi;
• Engines de Data Lake: Dremio, Trino, • Exemplos de Pipeline de Dados em
Presto; tempo real com Apache Kafka.
• Soluções de Armazenamento
escalável - Apache Druid, Apache Duração: 32 horas
Pinot, ElasticSearch.
5 Desafio Final
Duração: 32 horas

Conclusão da aplicação final.


4 Pipelines de Dados Duração: 16 horas

• Atividades do pipeline de dados:


aquisição, transformações, ingestão;
11

Contato

Rua Roma 561, Santa Lúcia.


CEP 30.360-680
Belo Horizonte, Minas Gerais

www.igti.com.br

0800 200 4488 | (31) 3047-3612

Inscreva-se no programa

Você também pode gostar