Escolar Documentos
Profissional Documentos
Cultura Documentos
Python Help
http://pythonprogramminglanguage.com/
Tipos bsicos:
-
Tupla: (1,2,3,4)
Lista: [1,2,3,4]
String: teste ou Hello World
HashMap ou Dicionrio: {maria:2000, joao: 2000}
Pydoop
Pydoop uma interface Python para Hadoop que lhe permite escrever
aplicativos MapReduce em Python puro. Pydoop oferece vrios recursos que
normalmente no so encontrados em outras bibliotecas Python para
Hadoop:
WordCount Pydoop
Assumindo que no parametro text do mapper ser informado cada linha
do arquivo.
def mapper(_, text, writer):
for word in text.split():
writer.emit(word, 1)
def reducer(word, icounts, writer):
writer.emit(word, sum(map(int,icounts)))
Mximo de um estoque
Assumindo que no parametro text do mapper ser informado cada linha
do arquivo.
def mapper(_, text, writer):
columns = text.split("\t")
writer.emit(columns[0], columns[1])
def reducer(key,values,writer):
writer.emit(key, max(map(int,values)))
Mnimo de um estoque
Assumindo que no parametro text do mapper ser informado cada linha
do arquivo.
def mapper(_, text, writer):
columns = text.split("\t")
writer.emit(columns[0], columns[1])
def reducer(key,values,writer):
writer.emit(key, min(map(int,values)))
Total de um estoque
Assumindo que no parametro text do mapper ser informado cada linha
do arquivo.
def mapper(_, text, writer):
columns = text.split("\t")
writer.emit(columns[0], columns[1])
def reducer(key,values,writer):
writer.emit(key, sum(map(int,values)))
Exerccio
http://content.udacity-data.com/courses/ud617/purchases.txt.gz
http://content.udacity-data.com/courses/ud617/access_log.gz
https://raw.githubusercontent.com/tocology/hadoop_python/master/data/customer-orders.csv
http://archive.ics.uci.edu/ml/datasets/Restaurant+%26+consumer+data