Você está na página 1de 5

ANALISIS CLUSTER NONHIRARKI

Metode cluster nonhirarki diawali dengan proses penentuan jumlah cluster


terlebih dahulu. Secara umum metode ini meminimumkan fungsi objektif atau
kriteria optimal sehingga dapat mengatasi masalah optimasi untuk memenuhi
kriteria optimal. Salah satu metode pada metode non-hirarki yaitu partitioning
clustering. Partitioning clustering merupakan metode rekontruktif yang berusaha
meminimumkan fungsi objektif. Contoh dari partitioning clustering antara lain
algoritma K-Means clustering.

Metode k-Means

Metode K-Means pertama kali diperkenalkan oleh James B MacQueen


pada tahun 1967 dalam proceeding of the 5th berkeley symposium on
Mathematical Statistic and Probability. Dasar pengelompokkan dalam metode ini
adalah menempatkan objek berdasarkan rata-rata cluster terdekat. Oleh karena itu,
metode ini bertujuan untuk meminimumkan error akibat partisi n objek ke dalam
k cluster. Error partisi disebut sebagai fungsi objektif.
Misalkan X = {Xi}, i = 1,2, ...,n merupakan titik-titik dalam ruang
berdimensi n (Rn) dan titik tersebut dikelompokkan ke dalam i cluster, Ci, i = 1,2,
..., k. Misalkan ci centroid dari cluster ci sehingga jumlah kuadrat antara ci dan
titik di dalam cluster yaitu xi, didefinisikan sebagai berikut.
J (ck )   xici (ci  xi ) 2 (1.1)

Prinsip dasar metode K-Means adalah meminimumkan jumlah kuadrat


error dari seluruh i cluster adalah sebagai berikut.
k
SSE   xici (ci  xi) 2 (1.2)
i 1
Komponen K-Means
Algoritma K-Means memerlukan 3 komponen adalah sebagai berikut.
1. Jumlah Cluster K
K-Means merupakan bagian dari metode non-hirarki sehingga dalam
metode ini jumlah K harus ditentukan terlebih dahulu. Jumlah cluster dapat
ditentukan melalui pendekatan metode hirarki. Namun perlu diperhatikan bahwa
tidak terdapat aturan khusus dalam menentukan jumlah cluster K, terkadang
jumlah cluster yang diinginkan tergantung pada subjektif seseorang.
2. Cluster Awal
Cluster awal yang dipilih berkaitan dengan penentuan pusat cluster awal
(centroid awal). Oleh karena adanya pemilihan cluster awal yang berbeda ini
maka kemungkinan besar solusi cluster yang dihasil akan berbeda pula.
3. Ukuran Jarak
Dalam hal ini, ukuran jarak digunakan untuk menentukan observasi ke
dalam cluster berdasarkan centroid terdekat. Ukuran jarak yang digunakan dalam
metode K-Means adalah jarak Euclidean.

Algoritma K-Means
Adapun algoritma K-Means dalam pembentukan cluster sebagai berikut.
1. Matriks data X = {xij} berukuran nxp dengan i = 1,2, ...,n, j = 1,2,...,p dan
asumsikan jumlah cluster awal K
2. Tentukan pusat cluster
3. Menghitung jarak setiap objek ke setiap centroid dengan menggunakan
jarak Euclidean atau dapat ditulis sebagai berikut.

d ( xi , ci )  ( xi  ci ) 2 (1.3)

4. Setiap objek disusun ke centroid terdekat dan kumpulan objek tersebut


akan membentuk cluster.
5. Menentukan centroid baru dari cluster yang baru terbentuk, dimana
centroid baru itu diperoleh dari rata-rata setiap objek yang terlatak pada
cluster yang sama.
6. Mengulang langkah 3, jika centroid awal dan baru tidak sama.
CONTOH PENGHITUNGAN DENGAN METODE K-MEANS

Tabel 1.1 Daftar obyek yang akan diolah dalam clustering


Obyek atribut1 (X): indeks atribut 2 (Y): pH
berat
Obat A 1 1
Obat B 2 1
Obat C 4 3
Obat D 5 4

2. Menghitung jarak obyek ke centroid dengan menggunakan rumus jarak Euclid.

Misalnya jarak obyek pupuk C=(4,3) ke centroid pertama adalah

dan jaraknya dengan centroid kedua

adalah .
Hasil perhitungan jarak ini disimpan dalam bentuk matriks k x n, dengan k
banyaknya cluster dan n banyak obyek. Setiap kolom dalam matriks tersebut
menunjukkan obyek sedangkan baris pertama menunjukkan jarak ke centroid
pertama, baris kedua menunjukkan jarak ke centroid kedua. Matriks jarak
setelah iterasi ke-0 adalah sebagai berikut:

3. Clustering obyek : Memasukkan setiap obyek ke dalam cluster (grup)


berdasarkan jarak minimumnya. Jadi obat A dimasukkan ke grup 1, dan obat
B, C dan D dimasukkan ke grup 2. Keanggotaan obyek ke dalam grup
dinyatakan dengan matrik, elemen dari matriks bernilai 1 jika sebuah obyek
menjadi anggota grup.
4. Iterasi-1, menetukan centroid : Berdasarkan anggota masing-masing grup,
selanjutnya ditentukan centroid baru. Grup 1 hanya berisi 1 obyek, sehingga

centroidnya tetap . Grup 2 mempunyai 3 anggota, sehingga


centroidnya ditentukan berdasarkan rata-rata koordinat ketiga anggota tersebut:

5. Iterasi-1, menghitung jarak obyek ke centroid: selanjutnya, jarak antara


centroid baru dengan seluruh obyek dalam grup dihitung kembali sehingga
diperoleh matriks jarak sebagai berikut:

6. Iterasi-1, clustering obyek: langkah ke-3 diulang kembali, menentukan


keanggotaan grup berdasarkan jaraknya. Berdasarkan matriks jarak yang baru,
maka obat B harus dipindah ke grup 2.

7. Iterasi-2, menentukan centroid: langkah ke-4 diulang kembali untuk


menentukan centroid baru berdasarkan keanggotaan grup yang baru. Grup 1
dan grup 2 masing-masing mempunyai 2 anggota, sehingga centroidnya

menjadi dan

8. Iterasi-2, menghitung jarak obyek ke centroid : ulangi langkah ke-2, sehingga


diperoleh matriks jarak sebagai berikut:
9. Iterasi-2, clustering obyek: mengelompokkan tiap-tiap obyek berdasarkan jarak
minimumnya, diperoleh:

Hasil pengelompokkan pada iterasi terakhir dibandingkan dengan hasil

sebelumnya, diperoleh . Hasil ini menunjukkan bahwa tidak ada lagi


obyek yang berpindah grup, dan algoritma telah stabil. Hasil akhir clustering
ditunjukkan dalam Tabel 2.
Tabel 1.2 Hasil clustering
Obyek atribut1 (X): indeks atribut 2 (Y): pH Grup hasil
berat
Obat A 1 1 1
Obat B 2 1 1
Obat C 4 3 2
Obat D 5 4 2

Você também pode gostar