Escolar Documentos
Profissional Documentos
Cultura Documentos
I. O MapReduce com Hadoop tradicional é em torno de 100 vezes mais rápido do que o
processamento com o Spark;
II. O Spark permite um desempenho em torno de 100 vezes mais rápido que o MapReduce com
Hadoop tradicional.;
III. Como característica principal o Spark otimiza os processos executados através do Hadoop
MapReduce em memória;
I. O Resilient Distributed Datasets (RDD) é o conceito central da plataforma Spark. Foi desenvolvido
para suportar o armazenamento de dados na memória e distribuído ou em um cluster, que implementa
sua tolerância a falhas, devido, em parte, ao seu rastreamento de dados brutos ou processamentos.;
II. O RDD é uma funcionalidade permite que usuários da plataforma ou software R utilizem funções ou
funcionalidades Spark de maneira mais usual.;
III. Spark Streaming aproveita a capacidade de processamento rápido da Spark Core para executar os
processamentos. Permite a execução e transformações RDD (Solids Distributed Datasets) nesses
pedações menores de dados e lotes de processamento.;
https://bb.cruzeirodosulvirtual.com.br/ultra/courses/_628228_1/cl/outline 1/2
17/08/2020 Blackboard Learn
II. O projeto Mahout possui implementações de diversos algoritmos em sua execução direta no
Hadoop com o Mapreduce;
III. O projeto Mahout não permite integração e implementações de algoritmo usando o Spark;
https://bb.cruzeirodosulvirtual.com.br/ultra/courses/_628228_1/cl/outline 2/2