Escolar Documentos
Profissional Documentos
Cultura Documentos
o
Agrupamento
k-Means
no
WEKA
(verso
3.5.8)
Este
exemplo
ilustra
a
utilizao
do
algoritmo
de
agrupamento
k-means
no
WEKA
O
conjunto
de
dados
utilizado
neste
exemplo
baseia-se
no
"bank
data"
disponvel
no
formato
csv
(bank-data.csv).
Assumimos
que
j
foi
realizado
o
pr-processamento
apropriado.
Neste
caso,
o
campo
ID
foi
removido
e
o
atributo
"children"
foi
discretizado
(notem
que
isso
no
exigido
para
fazer
agrupamento).
O
ficheiro
de
dados
resultante
"bank.arff"
e
inclui
600
instncias.
Vamos
usar
o
k-means
para
agrupar
os
clientes
do
banco
e
para
caracterizar
os
segmentos
de
clientes.
A
Figura
1
mostra
o
interface
do
WEKA
Explorer
j
com
o
ficheiro
de
dados
carregado.
Figura
1
Figura 2
Figura 3
Podemos
clicar
com
o
boto
da
direita
sobre
o
painel
"Result
list"
e
visualizar
os
resultados
numa
janela
separada
(vejam
a
figura
4).
A
janela
resultante
mostra
o
centride
de
cada
agrupamento
bem
como
as
estatsticas
quanto
ao
nmero
e
percentagem
de
instncias
atribudas
aos
diferentes
agrupamentos.
Os
centrides
dos
agrupamentos
so
os
vectores
mdios
de
cada
grupo
(cada
um
dos
valores
correspondentes
a
uma
dimenso
representam
o
valor
mdio
para
essa
dimenso
em
todo
o
grupo).
Assim,
os
centrides
caracterizam
os
agrupamentos.
Por
exemplo,
o
centride
grupo
1
mostra
que
o
segmento
dos
casos
que
representam
mulheres
de
meia
idade
(idade
volta
de
38)
qe
vivem
no
centro
da
cidade
com
um
rendimento
mdio
de
aproximadamente
$28,500,
casadas
e
com
um
filho
apenas,
etc.
Este
grupo
respondeu
YES
ao
produto
PEP.
Figura 4
Figure
5
Figure
6