Escolar Documentos
Profissional Documentos
Cultura Documentos
JEANE A. MENEGUELI
HADOOP
• HADOOP YARN:
• Plataforma de Gerenciamento de recursos do cluster. Aloca recursos computacionais
para aplicações que queiram fazer um processamento distribuído.
• HADOOP MAPREDUCE:
• modelo de programação paralela e distribuída para processamento em larga escala.
Todo o MapReduce original está implementado agora no HADOOP YARN.
MÓDULOS DO HADOOP
• HADOOP COMMOM
• Contém as bibliotecas e arquivos comuns e necessários para todos os módulos Hadoop.
• HADOOP DISTRIBUTED FILE SYSTEM (HDFS):
• Sistema de Arquivos distribuído que armazena dados em máquinas dentro do cluster, sob
demanda, permitindo uma largura de banda muito grande em todo o cluster. Gerencia os
dados armazenados em disco no cluster.
• HADOOP YARN:
• Plataforma de Gerenciamento de recursos do cluster. Aloca recursos computacionais para
aplicações que queiram fazer um processamento distribuído.
• HADOOP MAPREDUCE:
• modelo de programação paralela e distribuída para processamento em larga escala. Todo
o MapReduce original está implementado agora no HADOOP YARN.
• HADOOP HDSF e HADOO YARN:
• Componentes principais que implementam o armazenamento e o processamento
distribuído
HADOOP - INSTALAÇÃO
• Windows
• https://cwiki.apache.org/confluence/display/HADOOP2/Hadoop2OnWindows
• Linux
• http://www.apache.org/dyn/closer.cgi/hadoop/common/
• https://www.youtube.com/watch?v=db_-JfTRKxQ
• Virtual Box
• https://www.youtube.com/watch?v=znC8S0H_7QQ
• Cluster de Nó único
• https://hadoop.apache.org/docs/stable/hadoop-project-dist/hadoop-
common/SingleCluster.html
• Cluster com alguns nós
• Cluster com milhares de nós
HADOOP – REQUISITOS
• Java / JDKs
• https://cwiki.apache.org/confluence/display/HADOOP2/HadoopJavaVers
ions
• hadoop.apache.org
• https://www.cloudera.com/downloads/cdp-private-cloud-trial.html
• Espelhos
• http://www.apache.org/dyn/closer.cgi/hadoop/common/
• Cloudera
• www.cloudera.com/downloads.html
HADOOP