Escolar Documentos
Profissional Documentos
Cultura Documentos
Aula Usando Weka
Aula Usando Weka
UTILIZANDO O
SOFTWARE WEKA
O que
2
Universidade
fortes
Classificao
regras
de associao
clusters de dados
6/25/2013
Weka Explorer
3
Weka Explorer
4
Opes disponveis
Preprocess: escolhe e modifica os dados utilizados
Classify: treina e testa sistemas de aprendizagem
que classificam ou realizar regresso
Cluster: anlise de clusters
Associate: permite aprender regras de associao
para os dados
Select attributes: seleciona os atributos mais
relevantes nos dados
Visualize: grfico 2D interativo dos dados
6/25/2013
Weka Explorer
5
Open File...
Abre
File Format
Arquivo ARFF
6
O que ?
O
formato ARFF
utilizado como padro
para estruturar as
bases de dados
manipuladas pela
Weka
um arquivo de texto
ASCII que descreve
uma lista de instncias
que compartilham um
conjunto de atributos
cabealho
dados
6/25/2013
formatos
Excluir atributos
Acessar estatsticas bsicas
Aplicar um filtro aos dados
Ex.:
zscore
6/25/2013
Viso geral
Filtros
Estatsticas
do atributo
selecionado
Atributos
existentes
Filtros
Permitem
transformar os dados
de vrias maneiras
Ex:
Adicionar rudo
Clicando
no nome do filtro,
podemos configur-lo
6/25/2013
zscore
normaliza
os dados
Selecione
weka.filters.unsupervised.attribute.
Standardize
Clicando
12
6/25/2013
arquivo de teste
Realizar cross-validation
Etc.
Viso Geral
Classificadores
Metodologia
de teste
Resultados do
classificador
ltimos
testes
6/25/2013
Metodologia de teste
Use
training set
Usa
Supplied
Permite
test set
selecionar um arquivo com os casos de teste
Cross-validation
Usa
Percentage
Usa
split
rvores de Deciso
16
Selecione
weka.classifiers.trees
J48
Id3
LMT
6/25/2013
rvores de Deciso
17
Configurando o
classificador
Clicando
no nome
dele, podemos
configur-lo
Ex.: rvore J48
rvores de Deciso
18
6/25/2013
rvores de Deciso
19
Selecione
weka.classifiers.lazy
IBk
K-NN
usando K = 1
KStar
K-NN
10
6/25/2013
Configurando o
classificador
Clicando
no nome
dele, podemos
configur-lo
Ex.: IBk (K-NN)
Bayeslearning - aprendizado
preguioso
22
11
6/25/2013
Classificadores Bayesianos
23
Selecione
weka.classifiers.bayes
ComplementNaiveBayes
Classificao
classe
NaiveBayes
Classificao
classes
Classificadores Bayesianos
24
NaiveBayesUpdateable
Classificao
12
6/25/2013
Classificadores Bayesianos
25
Configurando o
classificador
Clicando
no nome
dele, podemos
configur-lo
Ex.: BayesNet
Classificadores Bayesianos
26
por classe
13
6/25/2013
Classificadores Bayesianos
27
da classificao
Regresso
28
Selecione
weka.classifiers.functions
14
6/25/2013
Regresso
29
como o SimpleLinearRegression
Usa o critrio de Akaike (medida da qualidade
relativa) para seleo do modelo de regresso (linear
ou mltipla)
capaz de lidar com casos ponderados
Regresso
30
Configurando o classificador
Clicando
15
6/25/2013
Regresso
31
sellingPrice
Regresso
32
SimpleLinearRegressio
n
16
6/25/2013
Redes Neurais
33
Selecione
weka.classifiers.functions
MultiLayerPreceptron
Redes Neurais
34
Configurando o
classificador
training
Nro
time
de iteraes
learning
rate
Incremento
do ajuste de
pesos no back propogation
momentum
Controla
as mudanas nas
variaes dos incrementos
17
6/25/2013
Redes Neurais
35
Configurando o classificador
hiddenLayers
Nro
Redes Neurais
36
Configurando o classificador
GUI:
18
6/25/2013
Redes Neurais
37
SVM
38
Selecione
weka.classifiers.functions
Mtodo disponveis
SMO
Implementa
LibSVM
Pacote
19
6/25/2013
SVM
39
Configurando SMO
filterType
Determina
como/se
os dados sero
transformados
Kernel
Define
o kernel a ser
usado
SVM
40
Configurando SMO
numFolds
Nmero
de folds da
validao cruzada
-1 significa que os
dados de treinamento
sero usados
No
modificar
toleranceParameter
epsilon
checksTurnedOff
20
6/25/2013
SVM
41
LibSVM
Caractersticas
Diferentes
formulaes SVM
Classificao multi-classes mais eficiente
Validao cruzada para seleo de modelos
Estimativas de probabilidade
Vrios kernels (incluindo matriz de kernel precalculado)
SVM ponderada para dados desbalanceados
SVM
42
Configurando o
libSVM
svm_type
Seleciona
o tipo de
SVM
kernel_type
Seleciona
a funo
kernel
Demais
parmetros
Funcionamento
semelhante ao do
SMO
ou sua configurao
depende do tipo de
SVM usada
21
6/25/2013
SVM
43
SVM
44
22
6/25/2013
45
prprios dados
Fornecer arquivo de teste
Etc.
23
6/25/2013
Viso Geral
Tipos de
Agrupamentos
Metodologia
de avaliao
Resultados do
agrupamento
ltimos
testes
Metodologia de avaliao
Use
training set
Classifica
Supplied
test set
Permite
Percentage
split
Usa
24
6/25/2013
Metodologia de avaliao
Classes
to clusters evaluation
Ignora
Anlise de Clusters
50
Selecione
weka.clusterers
Mtodo disponveis
SimpleKMeans
K-means
EM
Expectation
maximization ou maximizao de
expectativa
Gera descries probabilsticas dos clusters em
termos de mdia e desvio padro para os atributos
numricos
25
6/25/2013
Anlise de Clusters
51
Mtodo disponveis
Cobweb
Gera
HierarchicalClusterer
Implementa
Anlise de Clusters
52
Configurando o
mtodo (Ex.:
SimpleKMeans)
distanceFunction
Funo
de distncia
maxIterations
Nro
de iteraes
mximas
numClusters
Nro
de clusters
Seed
Nro
de sementes
iniciais
26
6/25/2013
Anlise de Clusters
53
Anlise de Clusters
54
27
6/25/2013
55
56
em 2 etapas:
Um
mtodo de busca:
Um mtodo de avaliao
Flexibilidade:
28
6/25/2013
57
Viso Geral
Metodologia
de busca
Mtodologia de
avaliao
Modo de
seleo dos
atributos
Resultados da
seleo
ltimos
testes
58
29
6/25/2013
59
Metodologia de busca
Use
training set
Classifica
Supplied
test set
Permite
Percentage
split
Usa
60
Metodologia de avaliao
Classes
to clusters evaluation
Ignora
30
6/25/2013
Anlise de Clusters
61
Selecione
weka.clusterers
Mtodo disponveis
SimpleKMeans
K-means
EM
Expectation
maximization ou maximizao de
expectativa
Gera descries probabilsticas dos clusters em
termos de mdia e desvio padro para os atributos
numricos
Seleo de atributos
62
Mtodo disponveis
Cobweb
Gera
HierarchicalClusterer
Implementa
31
6/25/2013
Seleo de atributos
63
Configurando o
mtodo (Ex.:
SimpleKMeans)
distanceFunction
Funo
de distncia
maxIterations
Nro
de iteraes
mximas
numClusters
Nro
de clusters
Seed
Nro
de sementes
iniciais
Seleo de atributos
64
32
6/25/2013
Seleo de atributos
65
33