Escolar Documentos
Profissional Documentos
Cultura Documentos
Aula 1 ●
●
Perfis profissionais das áreas de Dados
Fundamentos de Arquitetura Paralela
● Fundamentos de Arquitetura Distribuída
● Algoritmos de MPP
● LAB 1 - Hands-On Hadoop e ETL
INTRODUÇÃO AO BIG DATA
● Volume
● Velocidade
● Variedade
Fonte: NIST.http://dx.doi.org/10.6028/NIST.SP.1500-1
5V’s de Big Data
Fonte: NIST.http://dx.doi.org/10.6028/NIST.SP.1500-1
Habilidades necessárias nas áreas de
Data Science
Fonte: NIST.http://dx.doi.org/10.6028/NIST.SP.1500-1
Unicórnio
Fonte: WIKIPÉDIA.https://en.wikipedia.org/wiki/Unicorn#/media/File:Oftheunicorn.jpg
Fatiando o Unicórnio
Engenheiro de Dados
Engenheiro de Machine Learning
Cientista de Dados
Arquiteto de Big Data
Especialista do Negócio / Analista de Dados
Especialista em Governança de Dados
Fonte: NIST.http://dx.doi.org/10.6028/NIST.SP.1500-1
Arquiteto de Big Data
BASIC QUALIFICATIONS
· Highly technical and analytical with 10 or more years of ETL and analytics systems development and deployment experience
· Strong verbal and written communications skills are a must, as well as the ability to work effectively across internal and external
organizations and virtual teams.
· Ability to think understand complex business requirements and render them as prototype systems with quick turnaround time.
· Implementation and tuning experience in the Big Data Ecosystem, (such as Hadoop, Spark, Presto, Hive), Database (such as Oracle,
MySQL, PostgreSQL, MS SQL Server) and Data Warehouses (such as Redshift, Teradata, Vertica)
· Knowledge of foundation infrastructure requirements such as Networking, Storage, and Hardware Optimization with Hands-on
experience with Amazon Web Services (AWS)
· BS level technical degree required; Computer Science or Mathematics background preferred
BIG DATA
DATA ARCHITECT
Para se tornar um Arquiteto de
ENGINEER SR
DATA Big Data de verdade você
Experiência em
ENGINEER JR projetos envolvendo
deverá possuir experiência em
DBA SR Engenheiro de
Cloud, Infraestrutura
negócios, SQL, Programação,
Infraestrutura, Cloud, Gestão
Administrador de Dados. Fora
DBA JR Local, diferentes
de Projeto, Pessoas,ótima
Banco de Dados linguagem SQL
Administrador de ferramentas de ETL.
comunicação verbal, empatia,
Sênior. SQL e Vasta utiliza programação.
Banco de Dados. Python, Java, API’s e
Shell, Python e Java detalhista e paciente. Estar
experiência com automação.
Conhecimentos em atento às novas tecnologias e
Infraestrutura e
SQL
Obs:.Baseado nos conhecimentos e experiência
Linux do professor e do mercado, além disso também foram utilizadas vagas em aberto por:inovações será fundamental
Amazon, Google, Uber, Airbnb.
para se manter atualizado e em
Engenheiro de Dados vs Cientista de
Dados
WKIPEDIA, https://en.wikipedia.org/wiki/Flynn%27s_taxonomy
Arquitetura Paralela
WKIPEDIA, https://en.wikipedia.org/wiki/Flynn%27s_taxonomy
Arquitetura Distribuída
WKIPEDIA, https://en.wikipedia.org/wiki/Flynn%27s_taxonomy
WKIPEDIA, https://pt.wikipedia.org/wiki/Sistema_de_processamento_distribu%C3%ADdo
Arquitetura Paralela
WKIPEDIA, https://en.wikipedia.org/wiki/Flynn%27s_taxonomy
ECOSSISTEMA HADOOP
Entendendo profundamente os
componentes de Big Data ( Sistema de
Arquivos )
HDFS, S3, GEN2, OBS, GS
MPPs ( Massively Parallel Processors )
WHITE, T. Hadoop: The Definitive Guide, 4th Edition, O’Reilly Media, 2015.
O que é o Hadoop?
WHITE, T. Hadoop: The Definitive Guide, 4th Edition, O’Reilly Media, 2015.
Ecossistema do Hadoop ( Meet Hadoop )
WHITE, T. Hadoop: The Definitive Guide, 4th Edition, O’Reilly Media, 2015.
O Ecossistema Hadoop ( Meet Hadoop )
● Hive
○ A SQL-like interface to Hadoop files
● Spark ( Spark SQL )
○ An in-memory execution system
● Yarn
○ A distributed resource manager
● Oozie
○ A workflow system
● HBase
○ A NoSQL Database
WHITE, T. Hadoop: The Definitive Guide, 4th Edition, O’Reilly Media, 2015.
O que é o MapReduce?
WHITE, T. Hadoop: The Definitive Guide, 4th Edition, O’Reilly Media, 2015.
O que é o MapReduce?
WHITE, T. Hadoop: The Definitive Guide, 4th Edition, O’Reilly Media, 2015.
Como o MapReduce funciona no Hadoop?
WHITE, T. Hadoop: The Definitive Guide, 4th Edition, O’Reilly Media, 2015.
Como funciona o HDFS?
WHITE, T. Hadoop: The Definitive Guide, 4th Edition, O’Reilly Media, 2015.
Como funciona a replicação de blocos?
WHITE, T. Hadoop: The Definitive Guide, 4th Edition, O’Reilly Media, 2015.
Sqoop ( SQL to Hadoop )
WHITE, T. Hadoop: The Definitive Guide, 4th Edition, O’Reilly Media, 2015.
Sqoop ( SQL to Hadoop )
WHITE, T. Hadoop: The Definitive Guide, 4th Edition, O’Reilly Media, 2015.
Sqoop ( Hadoop to SQL )
WHITE, T. Hadoop: The Definitive Guide, 4th Edition, O’Reilly Media, 2015.