Analisis Cluster Nonhirarki

ANALISIS CLUSTER NONHIRARKI
Metode cluster nonhirarki diawali dengan proses penentuan jumlah cluster

terlebih dahulu. Secara umum metode ini meminimumkan fungsi objektif atau
kriteria optimal sehingga dapat mengatasi masalah optimasi untuk memenuhi
kriteria optimal. Salah satu metode pada metode non-hirarki yaitu partitioning
clustering. Partitioning clustering merupakan metode rekontruktif yang berusaha
meminimumkan fungsi objektif. Contoh dari partitioning clustering antara lain
algoritma K-Means clustering.
Metode k-Means
Metode K-Means pertama kali diperkenalkan oleh James B MacQueen

pada tahun 1967 dalam proceeding of the 5th berkeley symposium on
Mathematical Statistic and Probability. Dasar pengelompokkan dalam metode ini
adalah menempatkan objek berdasarkan rata-rata cluster terdekat. Oleh karena itu,
metode ini bertujuan untuk meminimumkan error akibat partisi n objek ke dalam
k cluster. Error partisi disebut sebagai fungsi objektif.
Misalkan X = {Xi}, i = 1,2, ...,n merupakan titik-titik dalam ruang
berdimensi n (Rn) dan titik tersebut dikelompokkan ke dalam i cluster, Ci, i = 1,2,
..., k. Misalkan ci centroid dari cluster ci sehingga jumlah kuadrat antara ci dan
titik di dalam cluster yaitu xi, didefinisikan sebagai berikut.
J (ck )   xici (ci  xi ) 2 (1.1)
Prinsip dasar metode K-Means adalah meminimumkan jumlah kuadrat

error dari seluruh i cluster adalah sebagai berikut.
k
SSE   xici (ci  xi) 2 (1.2)
i 1
Komponen K-Means
Algoritma K-Means memerlukan 3 komponen adalah sebagai berikut.
1. Jumlah Cluster K
K-Means merupakan bagian dari metode non-hirarki sehingga dalam
metode ini jumlah K harus ditentukan terlebih dahulu. Jumlah cluster dapat
ditentukan melalui pendekatan metode hirarki. Namun perlu diperhatikan bahwa
tidak terdapat aturan khusus dalam menentukan jumlah cluster K, terkadang
jumlah cluster yang diinginkan tergantung pada subjektif seseorang.
2. Cluster Awal
Cluster awal yang dipilih berkaitan dengan penentuan pusat cluster awal
(centroid awal). Oleh karena adanya pemilihan cluster awal yang berbeda ini
maka kemungkinan besar solusi cluster yang dihasil akan berbeda pula.
3. Ukuran Jarak
Dalam hal ini, ukuran jarak digunakan untuk menentukan observasi ke
dalam cluster berdasarkan centroid terdekat. Ukuran jarak yang digunakan dalam
metode K-Means adalah jarak Euclidean.
Algoritma K-Means
Adapun algoritma K-Means dalam pembentukan cluster sebagai berikut.
1. Matriks data X = {xij} berukuran nxp dengan i = 1,2, ...,n, j = 1,2,...,p dan
asumsikan jumlah cluster awal K
2. Tentukan pusat cluster
3. Menghitung jarak setiap objek ke setiap centroid dengan menggunakan
jarak Euclidean atau dapat ditulis sebagai berikut.
d ( xi , ci )  ( xi  ci ) 2 (1.3)
4. Setiap objek disusun ke centroid terdekat dan kumpulan objek tersebut

akan membentuk cluster.
5. Menentukan centroid baru dari cluster yang baru terbentuk, dimana
centroid baru itu diperoleh dari rata-rata setiap objek yang terlatak pada
cluster yang sama.
6. Mengulang langkah 3, jika centroid awal dan baru tidak sama.
CONTOH PENGHITUNGAN DENGAN METODE K-MEANS
Tabel 1.1 Daftar obyek yang akan diolah dalam clustering

Obyek atribut1 (X): indeks atribut 2 (Y): pH
berat
Obat A 1 1
Obat B 2 1
Obat C 4 3
Obat D 5 4
2. Menghitung jarak obyek ke centroid dengan menggunakan rumus jarak Euclid.
Misalnya jarak obyek pupuk C=(4,3) ke centroid pertama adalah
dan jaraknya dengan centroid kedua
adalah .
Hasil perhitungan jarak ini disimpan dalam bentuk matriks k x n, dengan k
banyaknya cluster dan n banyak obyek. Setiap kolom dalam matriks tersebut
menunjukkan obyek sedangkan baris pertama menunjukkan jarak ke centroid
pertama, baris kedua menunjukkan jarak ke centroid kedua. Matriks jarak
setelah iterasi ke-0 adalah sebagai berikut:
3. Clustering obyek : Memasukkan setiap obyek ke dalam cluster (grup)

berdasarkan jarak minimumnya. Jadi obat A dimasukkan ke grup 1, dan obat
B, C dan D dimasukkan ke grup 2. Keanggotaan obyek ke dalam grup
dinyatakan dengan matrik, elemen dari matriks bernilai 1 jika sebuah obyek
menjadi anggota grup.
4. Iterasi-1, menetukan centroid : Berdasarkan anggota masing-masing grup,
selanjutnya ditentukan centroid baru. Grup 1 hanya berisi 1 obyek, sehingga
centroidnya tetap . Grup 2 mempunyai 3 anggota, sehingga

centroidnya ditentukan berdasarkan rata-rata koordinat ketiga anggota tersebut:
5. Iterasi-1, menghitung jarak obyek ke centroid: selanjutnya, jarak antara

centroid baru dengan seluruh obyek dalam grup dihitung kembali sehingga
diperoleh matriks jarak sebagai berikut:
6. Iterasi-1, clustering obyek: langkah ke-3 diulang kembali, menentukan

keanggotaan grup berdasarkan jaraknya. Berdasarkan matriks jarak yang baru,
maka obat B harus dipindah ke grup 2.
7. Iterasi-2, menentukan centroid: langkah ke-4 diulang kembali untuk

menentukan centroid baru berdasarkan keanggotaan grup yang baru. Grup 1
dan grup 2 masing-masing mempunyai 2 anggota, sehingga centroidnya
menjadi dan
8. Iterasi-2, menghitung jarak obyek ke centroid : ulangi langkah ke-2, sehingga

diperoleh matriks jarak sebagai berikut:
9. Iterasi-2, clustering obyek: mengelompokkan tiap-tiap obyek berdasarkan jarak
minimumnya, diperoleh:
Hasil pengelompokkan pada iterasi terakhir dibandingkan dengan hasil
sebelumnya, diperoleh . Hasil ini menunjukkan bahwa tidak ada lagi

obyek yang berpindah grup, dan algoritma telah stabil. Hasil akhir clustering
ditunjukkan dalam Tabel 2.
Tabel 1.2 Hasil clustering
Obyek atribut1 (X): indeks atribut 2 (Y): pH Grup hasil
berat
Obat A 1 1 1
Obat B 2 1 1
Obat C 4 3 2
Obat D 5 4 2

Analisis Cluster Nonhirarki

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Analisis Cluster Nonhirarki

Enviado por

Direitos autorais:

Formatos disponíveis

ANALISIS CLUSTER NONHIRARKI

Metode cluster nonhirarki diawali dengan proses penentuan jumlah cluster

Metode K-Means pertama kali diperkenalkan oleh James B MacQueen

Prinsip dasar metode K-Means adalah meminimumkan jumlah kuadrat

4. Setiap objek disusun ke centroid terdekat dan kumpulan objek tersebut

Tabel 1.1 Daftar obyek yang akan diolah dalam clustering

2. Menghitung jarak obyek ke centroid dengan menggunakan rumus jarak Euclid.

Misalnya jarak obyek pupuk C=(4,3) ke centroid pertama adalah

dan jaraknya dengan centroid kedua

3. Clustering obyek : Memasukkan setiap obyek ke dalam cluster (grup)

centroidnya tetap . Grup 2 mempunyai 3 anggota, sehingga

5. Iterasi-1, menghitung jarak obyek ke centroid: selanjutnya, jarak antara

6. Iterasi-1, clustering obyek: langkah ke-3 diulang kembali, menentukan

7. Iterasi-2, menentukan centroid: langkah ke-4 diulang kembali untuk

8. Iterasi-2, menghitung jarak obyek ke centroid : ulangi langkah ke-2, sehingga

Hasil pengelompokkan pada iterasi terakhir dibandingkan dengan hasil

sebelumnya, diperoleh . Hasil ini menunjukkan bahwa tidak ada lagi

Você também pode gostar