Trab Tecnologias Avancadas

UNIVERSIDADE ESTÁCIO DE SÁ
MBA EM CIÊNCIA DE DADOS E BIG DATA ANALYTICS
Estudo de Caso
Lucas Luna Vieira
Trabalho da disciplina:
Tecnologias Avançadas
Tutor: Denis Cople
Rio de Janeiro
2020
6
MapReduce em Java
Referência:
Os dados utilizados neste trabalho estão dispostos no arquivo abaixo:
SalesJan2009.csv
Classe VendasPais:
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.*;
import org.apache.hadoop.mapred.*;
public class VendasPais {
public static void main(String[] args) {
JobClient my_client = new JobClient();
// Cria um objeto de configuração para o Job
JobConf job_conf = new JobConf(VendasPais.class);
// Seta o nome do Job
job_conf.setJobName("VendasPorPais");
// Especifica o tipo de dados da chave no valor de saída
job_conf.setOutputKeyClass(Text.class);
job_conf.setOutputValueClass(IntWritable.class);
6
// Especifica o nome das classes de Mapper e Reducer
job_conf.setMapperClass(VendasPais.VendasMapper.class);
job_conf.setReducerClass(VendasPais.VendasPaisReducer.class);
// Especifica os formatos dos dados de entrada e saída
job_conf.setInputFormat(TextInputFormat.class);
job_conf.setOutputFormat(TextOutputFormat.class);
// Define os diretórios de entrada e saída
FileInputFormat.setInputPaths(job_conf, new Path(args[0]));
FileOutputFormat.setOutputPath(job_conf, new Path(args[1]));
my_client.setConf(job_conf);
try {
// Rodando o Job
JobClient.runJob(job_conf);
} catch (Exception e) {
e.printStackTrace();
6
Classe VendasMapper:
import java.io.IOException;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
public class VendasMapper extends MapReduceBase implements Mapper<LongWritable, Text, Text,

IntWritable> {
private final static IntWritable one = new IntWritable(1);
public void map(LongWritable key, Text value, OutputCollector<Text, IntWritable> output,

Reporter reporter) throws IOException {
String valueString = value.toString();
String[] SingleCountryData = valueString.split(",");
output.collect(new Text(SingleCountryData[7]), one);
Classe VendasPaisReducer:
import java.io.IOException;
import java.util.*;
6
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
public class VendasPaisReducer extends MapReduceBase implements Reducer<Text, IntWritable,

Text, IntWritable> {
public void reduce(Text t_key, Iterator<IntWritable> values,

OutputCollector<Text,IntWritable> output, Reporter reporter) throws IOException {
Text key = t_key;
int frequenciaPorPais = 0;
while (values.hasNext()) {
// Substituição de valores
IntWritable value = (IntWritable) values.next();
frequenciaPorPais += value.get();
output.collect(key, new IntWritable(frequenciaPorPais));
6
Resultado - Vendas de produtos por país:

Trab Tecnologias Avancadas

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Trab Tecnologias Avancadas

Enviado por

Direitos autorais:

Formatos disponíveis

UNIVERSIDADE ESTÁCIO DE SÁ

MBA EM CIÊNCIA DE DADOS E BIG DATA ANALYTICS

public class VendasPais {

public static void main(String[] args) {

JobClient my_client = new JobClient();

// Cria um objeto de configuração para o Job

JobConf job_conf = new JobConf(VendasPais.class);

// Seta o nome do Job

// Especifica o tipo de dados da chave no valor de saída

// Especifica os formatos dos dados de entrada e saída

// Define os diretórios de entrada e saída

FileInputFormat.setInputPaths(job_conf, new Path(args[0]));

FileOutputFormat.setOutputPath(job_conf, new Path(args[1]));

public class VendasMapper extends MapReduceBase implements Mapper<LongWritable, Text, Text,

private final static IntWritable one = new IntWritable(1);

public void map(LongWritable key, Text value, OutputCollector<Text, IntWritable> output,

String valueString = value.toString();

String[] SingleCountryData = valueString.split(",");

output.collect(new Text(SingleCountryData[7]), one);

public class VendasPaisReducer extends MapReduceBase implements Reducer<Text, IntWritable,

public void reduce(Text t_key, Iterator<IntWritable> values,

Text key = t_key;

IntWritable value = (IntWritable) values.next();

output.collect(key, new IntWritable(frequenciaPorPais));

Você também pode gostar