Analisa Perbandingan Metode Hierarchical Clustering Dan Nonhierarchical Clustering

Data Mining and Knowledge Management
Analisa Perbandingan Metode Hierarchical Clustering dan Nonhierarchical

Clustering (Studi Kasus Pengelompokkan Kabupaten/Kota di Jawa Tengah
Tahun 2008 Berdasarkan Ukuran Moneter dan Nonmoneter)
Disusun Oleh:
Eko Wahyu Lestari
(12.7121)
Galang Retno Winarko
(12.7151)
Lukman Azhari
(12.7225)
Putu Agus Darmawan
(12.7315)
Kelas 3KS2
SEKOLAH TINGGI ILMU STATISTIK

Jalan Otto Iskandardinata 64C, Jakarta Timur, Jakarta
2014/2015
BAB I PENDAHULUAN
1.1 Latar Belakang
Kemiskinan merupakan suatu masalah yang terjadi di berbagai negara, terutama di negaranegara berkembang, termasuk Indonesia. Menurut Badan Pusat Statistik (BPS 2015), kemiskinan
adalah ketidakmampuan dari sisi ekonomi untuk memenuhi kebutuhan dasar makanan dan bukan
makanan yang diukur dari sisi pengeluaran. Kemiskinan sering kali disebut-sebut sebagai inti dari
masalah pembangunan di suatu daerah sehingga keberadaan data tentang kemiskinan tersebut
dirasa penting karena menyangkut arah dan tujuan pembangunan di suatu daerah. Secara
internasional, terdapat kesepakatan untuk menanggulangi kemiskinan yang tertuang dalam program
Millennium Development Goals (MDGs) butir pertama. Jika dilihat dari jumlah penduduk miskin,
Provinsi Jawa Tengah merupakan provinsi kedua yang jumlah penduduk miskinnya paling banyak,
yaitu sekitar 4,7 juta atau sekitar 16,48% dari jumlah penduduk miskin di Indonesia. Namun, jika
dilihat dari persentase penduduk miskin di Indonesia, Provinsi Jawa Tengah menempati posisi ke-10,
yaitu sebesar 14,44% (BPS, September 2013).
Karena pentingnya data tentang kemiskinan tersebut, perlu kiranya untuk mengelompokkan
daerah-daerah (dalam hal ini Kabupaten/Kota di Provinsi Jawa Tengah) berdasarkan ukuran
kemiskinan (Head Count Index, Poverty Gap Index, dan Poverty Severity Index) agar dapat diketahui
dengan cepat daerah mana saja yang perlu diberikan perhatian lebih dalam hal pengentasan dan
penanggulangan kemiskinan. Dalam hal ini, penulis bermaksud untuk mengelompokkan daerahdaerah
tersebut
menggunakan
algoritma
klastering
hierarki
Average
Linkage
dan
membandingkannya dengan algoritma klastering nonhierarki K-means.

1.2 Tujuan
Tulisan ini bertujuan untuk
a. Mengelompokkan Kabupaten/Kota di Jawa Tengah berdasarkan ukuran kemiskinan moneter
dan nonmoneter yang dicakup dalam 3 variabel yaitu Head Count Index, Poverty Gap Index,
dan Poverty Severity Index
b. Membandingkan penggunaan algoritma hierarchical clustering (Average linkage) dan
algoritma nonhierarchical clustering (K-means)
c. Memberikan rekomendasi arah kebijakan pemerintah dalam hal pengentasan kemiskinan
1.3 Konsep dan Definisi

Penduduk miskin adalah penduduk yang memiliki rata-rata pengeluaran per kapita per bulan di
bawah Garis Kemiskinan.
Kemiskinan adalah ketidakmampuan dari sisi ekonomi untuk memenuhi kebutuhan dasar makanan
dan bukan makanan yang diukur dari sisi pengeluaran.
Head Count Index (HCI-P0) adalah persentase penduduk miskin yang berada di bawah
GarisKemiskinan (GK).
Indeks Kedalaman Kemiskinan (Poverty Gap Index-P1) merupakan ukuran rata-rata kesenjangan
pengeluaran masing-masing penduduk miskin terhadap garis kemiskinan. Semakin tinggi nilai indeks,
semakin jauh rata-rata pengeluaran penduduk dari garis kemiskinan
Indeks Keparahan Kemiskinan (Poverty Severity Index-P2) memberikan gambaran mengenai
penyebaran pengeluaran di antara penduduk miskin. Semakin tinggi nilai indeks, semakin tinggi
ketimpangan pengeluaran di antara penduduk miskin.
Ukuran kemiskinan Moneter merupakan ukuran kemiskinan yang diukur berdasarkan variabel
moneter (kuantitatif) yaitu pendapatan dan pengeluaran konsumsi perkapita.
Ukuran kemiskinan Nonmoneter merupakan ukuran kemiskinan yang diukur berdasarkan variabel
nonmoneter (kualitatif) yaitu indikator individu dan indikator rumah tangga.
Clustering adalah proses membuat pengelompokan sehingga semua anggota dari setiap partisi
mempunyai persamaan berdasarkan matrik tertentu. Objek data yang terletak di dalam klaster harus
memiliki kemiripan sedangkan yang tidak berada dalam satu klaster tidak mempunyai kemiripan.
BAB II PEMBAHASAN
2.1 Kajian Teori
Metode Pengelompokan Hirarki
Metode pengelompokan hirarki digunakan apabila belum ada informasi jumlah
kelompok. Biasanya, hasil dari pengelompokan dengan metode ini adalah dendogram.
Metode Pengelompokan Nonhirarki
Metode pengelompokan nonhirarki bertujuan mengelompokkan n objek ke dalam k
kelompok (k<n). Salah satu prosedur pengelompokan dengan metode ini adalah KMeans. Algoritma K-Means adalah metode clustering berbasis jarak yang membagi data
ke dalam sejumlah klaster. Algoritma ini hanya dapat digunakan pada atribut numerik.
Ada banyak cara yang dapat digunakan untuk membandingkan performa dari algoritma KMeans dan algorima hierarki dalam penclusteran, tergantung dari ukuran apa yang digunakan.
Salah satu ukuran yang dapat digunakan dalam membandingkan algoritma tersebut adalah
dengan melihat nilai entropi dan nilai F Measure (yang dihitung dari nilai recall dan precision).
Entropi
Entropi memanfaatkan probabilitas dari klaster yang terbentuk yang dihitung dengan
rumus
n
E j Pij LogPij
i 1
di mana
Pij = probabilitas suatu anggota di klaster j untuk masuk ke cluster i.
Entropi dapat digunakan sebagai ukuran yang menunjukkan kualitas dari hasil clustering
(dengan catatan entropi yang terbaik terjadi saat setiap klaster memiliki tepat satu titik/data).
Nilai entropi yang lebih kecil menghasilkan klaster yang lebih bagus kualitasnya.
F Measure
F measure memanfaatkan ide presisi dan recall pada information retrieval, di mana setiap
klaster diperlakukan seolah-olah seperti hasil dari query dan masing-masing kelas seolaholah adalah set yang diinginkan dokumen untuk query, dengan rumus
recall (i, j )
nij
ni
precision(i, j )
nij
nj
di mana
n = jumlah anggota klaster
F Measure dihitung dengan rumus
F (i, j )
2 recall (i, j ) precision(i, j )

precision(i, j ) recall (i, j )
Nilai recall dan precision pada suatu keadaan dapat memiliki bobot yang berbeda. Ukuran
yang menampilkan timbal balik antara recall dan precision adalah F-measure yang merupakan
bobot rata-rata harmonik dari recall dan precision. Semakin besar nilai F-Measure, semakin baik
kualitas klaster tersebut.
Pada saat jumlah data meningkat, kinerja algoritma hirarki berjalan menurun dan waktu
untuk eksekusi meningkat. Waktu eksekusi algoritma K-Means juga meningkat tetapi jika
dibandingkan dengan algoritma hirarki kinerjanya lebih baik. Sebagai kesimpulan umum ,
algoritma K-Means baik untuk dataset yang besar dan hirarkis baik untuk dataset kecil .
Perbandingan antara algoritma ini dapat diimplementasikan atas dasar normalisasi, dengan
mengambil data yang dinormalisasi dan data yang tidak dinormalisasi akan memberikan hasil
yang berbeda .Tidak ada konsensus yang jelas dari dua algoritma ini yang dapat menghasilkan
pengelompokan yang lebih baik.
2.2 Sumber Data

Sampel yang digunakan sebanyak 35, yaitu kabupaten/kota di Provinsi Jawa Tengah dengan
jumlah variabel ada 6. Variabel tersebut terdiri dari ukuran kemiskinan moneter dan nonmoneter
yang masing-masing mempunyai 3 variabel, yaitu : presentase penduduk yang berada di bawah garis
kemiskinan (P0 untuk moneter dan P0* untuk nonmoneter), indeks kedalaman kemiskinan (P1 untuk
moneter dan P1* untuk nonmoneter), indeks keparahan kemiskinan (P2 untuk moneter dan P2* untuk
nonmoneter). Berikut ini adalah data yang digunakan.
Tabel 1 Data Ukuran Kemiskinan di Provinsi Jawa Tengah Tiap Kabupaten/Kota berdasarkan Susenas
Juli 2008
Kabupaten/Kota
(1)
Ukuran Kemiskinan Moneter
Ukuran Kemiskinan Nonmoneter
P0
P1
P2
P0*
P1*
P2*
(2)
(3)
(4)
(5)
(6)
(7)
Cilacap
21,3992
4,6727
1,3493
27,0558
13,7432
9,2395
Banyumas
22,9347
3,9484
0,9254
21,5845
9,5646
5,5311
Purbalingga
27,2908
5,3969
1,4885
26,5569
12,0025
7,5713
Banjarnegara
23,3406
5,7536
1,7193
31,9548
15,5654
10,1228
Kebumen
27,8737
7,0504
2,0473
22,0945
10,2846
6,1921
Purworejo
18,2223
4,1724
1,2146
17,2864
8,6210
5,6476
Wonosobo
27,7216
8,0687
2,8595
23,9390
9,2457
5,4481
Magelang
16,4889
5,0090
1,6948
21,8843
10,3929
6,4720
Boyolali
17,0762
3,6425
1,0149
32,4205
16,1113
10,4927
Klaten
21,7152
7,0936
2,5033
9,8069
2,7721
2,0764
Sukoharjo
12,1273
2,6338
0,7348
7,4471
3,0411
1,8631
Wonogiri
20,7108
6,0289
2,0555
24,4091
11,2168
7,1206
Karanganyar
15,6848
3,0155
0,7806
6,1175
1,8793
0,8686
Sragen
20,8341
3,4997
0,8460
26,8496
12,4314
7,9593
Grobogan
19,8351
4,4859
1,2319
58,2478
29,7677
19,6901
Blora
18,7922
5,1251
1,6115
64,7850
31,6278
20,8122
Rembang
27,2082
5,4754
1,4258
36,5165
17,0610
10,8962
Pati
17,9042
6,0099
2,0839
23,0363
11,6377
7,8362
Kudus
12,5799
5,7580
0,7052
6,0799
1,7488
0,7855
Jepara
11,0504
1,9916
0,4605
17,7879
8,2205
5,3200
Demak
21,2423
3,8609
0,8807
22,1639
9,7753
5,9686
Semarang
11,3729
2,3284
0,6537
17,2681
7,1223
4,2718
Temanggung
16,394
4,6622
1,5002
22,8160
7,9433
4,2502
Kendal
17,8684
4,0242
1,2336
26,5598
12,1225
7,5475
Batang
18,0824
5,4126
1,9274
32,8894
18,0746
12,9430
Pekalongan
19,5191
4,2270
1,0227
16,0557
7,4132
4,6654
Pemalang
23,9151
3,5898
0,8470
22,3749
10,8396
7,1295
Tegal
15,7832
2,6979
0,6786
12,9754
4,8037
2,4554
Brebes
25,9848
5,0560
1,3607
22,8626
10,4550
6,6121
Kota Magelang
11,1643
1,6758
0,4390
0,9312
0,2800
0,1290
Kota Surakarta
16,1259
2,7122
0,7511
0,4538
0,0920
0,0208
Kota Salatiga
8,4658
1,2831
0,3368
5,2759
1,7800
0,9657
Kota Semarang
5,9966
0,9900
0,2855
0,9749
0,2282
0,0861
Kota Pekalongan
10,2919
1,0311
0,1813
2,1577
0,6910
0,3111
Kota Tegal
11,2756
1,4195
0,2126
0,7955
0,2308
0,0762
Sumber: Skripsi Ricky Abdillah (2011)

Dari data di atas akan dibentuk 3 klaster yaitu klaster dengan tingkat kemiskinan tinggi,
sedang, dan rendah dengan menggunakan hierarchy clustering (Average Linkage) dan nonhierarchy
clustering (K-means). Dari hasil clustering tersebut, akan dibandingkan metode klater mana yang
lebih efektif untuk kasus di atas. Lebih lanjut, data yang diolah adalah data yang sudah distandarisasi
untuk mengurangi bias satuan. Kali ini penulis menggunakan alat bantu software SPSS 20 untuk
clustering data di atas.
2.3 Hierarchy Clustering Menggunakan Algoritma Average Linkage
Tabel 2 Case Processing Summary Algoritma Average Linkage
Berdasarkan tabel di atas, dapat dilihat bahwa data sejumlah 35 obyek telah diproses tanpa
ada data yang hilang.
Tabel 3 Agglomeration Schedule
Tabel di atas merupakan hasil proses clustering dengan metode Average Linkage. Jarak antar
variabel diukur dengan jarak euclidean kemudian dilakukan pengelompokan. Pengelompokan
dilakukan secara bertingkat.
Pada stage 1, terbentuk 1 klaster yang beranggotakan sampel nomor 34 dan 35 dengan jarak
0,093 (terdapat dalam kolom Coefficients). Karena proses aglomerasi dimulai dari 2 obyek yang
terdekat, maka jarak tersebut adalah yang terdekat dari sekian kombinasi jarak 35 obyek yang ada.
Angka 6 pada kolom terakhir, Next Stage, berarti clustering selanjutnya dilakukan pada stage 6.
Demikian seterusnya dari stage 6 dilanjutkan ke stage 14 hingga ke stage terakhir.
Proses aglomerasi ini bersifat kompleks, khususnya perhitungan koefisien yang melibatkan
sekian banyak obyek dan terus bertambah. Proses aglomerasi pada akhirnya akan menyatukan
semua obyek menjadi satu klaster. Klaster yang terbentuk dapat dilihat pada tabel 4 dan
dendogramnya dapat dilihat di gambar 1.
Tabel 4 Cluster Membership
Gambar 1 Dendogram using Average Linkage (Between Group)
2.4 Nonhierarchy Clustering Menggunakan Algoritma K-Means

Tabel 5 Iteration History
Dari tabel 5 dapat disimpulkan bahwa proses iterasi dilakukan sebanyak 5 kali. Proses ini dilakukan
untuk mendapatkan klaster yang sesuai. Jarak minimum antar pusat klaster yang terjadi dari hasil
iterasi adalah 5,918.
Tabel 6 Final Cluster Centers
Berdasarkan tabel 6, dapat dketahui bahwa data di atas masih terkait dengan proses
standarisasi yang mengacu pada z-score dengan ketentuan sebagai berikut.
Nilai negatif (-) berarti data berada di bawah rata-rata total
Nilai positif (+) berarti data berada di atas rata-rata total.
Sedangkan rumus yang digunakan adalah
. (1)
di mana:
X = Rata-rata sampel dalam cluster
= Rata-rata populasi
Z = Nilai standardisasi
= Standar Deviasi
Misalnya, apabila ingin mengetahui rata-rata P0 (presentase penduduk yang berada di bawah garis
kemiskinan moneter) dalam klaster 1 (X), maka
X
= (rata-rata P0 seluruh sampel) + (0,60332 x Standar Deviasi rata-rata P0)

= 18,1221 + (0,60332 x 5,77461)
= 21,606
Jadi rata-rata P0 yang berada pada klaster 1 adalah 21,606.
Untuk klaster yang lain dapat dicari rata-rata nilai masing-masing variabel dengan cara yang sama.
Berdasarkan tabel 6, dengan ketentuan yang telah dijelaskan di atas, dapat didefinisikan
sebagai berikut.
a. Klaster 1
Dalam klaster 1 ini berisi kabupaten/kota dengan nilai P0, P1, dan P2 yang tinggi dan nilai
P0*, P1*, dan P2* sedang, artinya kabupaten/kota dalam klaster 1 berdasarkan ukuran moneter
mempunyai presentase penduduk berada di bawah garis kemiskinan (P0) yang tinggi, rata-rata
kesenjangan pengeluaran masing-masing penduduk miskin terhadap garis kemiskinan (P1)
yang tinggi, dan ketimpangan pengeluaran di antara penduduk miskin (P2) yang tinggi.
Dalam ukuran nonmoneter, klaster ini mempunyai persentase penduduk berada di
bawah garis kemiskinan (P0*) yang sedang, rata-rata kesenjangan pengeluaran masing-masing
penduduk miskin terhadap garis kemiskinan yang sedang (P1*), dan ketimpangan pengeluaran
di antara penduduk miskin (P2*) yang sedang juga. Dengan demikian, dapat diduga bahwa
klaster-1 ini merupakan pengelompokan dari kabupaten/kota menengah yang mempunyai
pendapatan ataupun pengeluaran perkapita rendah namun mempunyai akses sanitasi, air
bersih, dan ukuran nonmoneter lain yang cukup mudah.
b. Klaster 2
Dalam klaster 2 ini berisi kabupaten/kota dengan nilai P0, P1, dan P2 serta P0*, P1*, dan
P2* yang rendah, artinya kabupaten/kota dalam klaster 2 berdasarkan ukuran moneter
mempunyai presentase penduduk berada di bawah garis kemiskinan (P0) yang rendah, ratarata kesenjangan pengeluaran masing-masing penduduk miskin terhadap garis kemiskinan (P1)
yang rendah, dan ketimpangan pengeluaran di antara penduduk miskin (P2) yang rendah.
Berdasarkan ukuran nonmoneter, klaster ini mempunyai presentase penduduk berada
di bawah garis kemiskinan (P0*) yang rendah, rata-rata kesenjangan pengeluaran masingmasing penduduk miskin terhadap garis kemiskinan (P1*) yang rendah, dan ketimpangan
pengeluaran di antara penduduk miskin (P2*) yang rendah. Berdasarkan hal tersebut, klaster-2
ini diduga merupakan pengelompokan dari kabupaten/kota yang maju, yaitu yang mempunyai
pendapatan ataupun pengeluaran perkapita tinggi dan juga mempunyai akses sanitasi, air
bersih, dan lain-lain yang sangat mudah.
c. Klaster 3
Dalam klaster 3 ini berisi kabupaten/kota dengan nilai P0, P1, dan P2 yang sedang dan
nilai P0*, P1*, dan P2* yang tinggi. Artinya, kabupaten/kota dalam klaster 3 berdasarkan ukuran
moneter mempunyai presentase penduduk berada di bawah garis kemiskinan (P0) yang
sedang, rata-rata kesenjangan pengeluaran masing-masing penduduk miskin terhadap garis
kemiskinan (P1) yang sedang, dan ketimpangan pengeluaran di antara penduduk miskin (P2)
yang sedang.
Jika dilihat berdasarkan ukuran nonmoneter, klaster ini mempunyai presentase
penduduk berada di bawah garis kemiskinan (P0*) yang tinggi, rata-rata kesenjangan
pengeluaran masing-masing penduduk miskin terhadap garis kemiskinan (P1*) yang tinggi,
serta ketimpangan pengeluaran di antara penduduk miskin (P2*) yang tinggi. Klaster-3 ini
diduga merupakan pengelompokan dari kabupaten/kota kecil yang mempunyai pendapatan
ataupun pengeluaran perkapita sedang namun mempunyai akses sanitasi, air bersih, dan
sebagainya yang sulit.
Perlu diingat kembali, penamaan masing-masing klaster sangat bersifat subjektif tergantung
pada peneliti dengan mengacu pada tujuan penelitian. Tabel berikut ini merupakan tabel Anova
yang dapat digunakan untuk melihat perbedaan variabel pada klaster yang terbentuk. Dalam hal ini
dapat dilihat dari nilai F dan nilai probabilitas (sig) masing-masing variabel.
Tabel 7 ANOVA
Kesimpulannya adalah semakin besar nilai F dan (sig < 0,05), maka semakin besar perbedaan
variabel pada klaster yang terbentuk.
Berdasarkan tabel yang didapatkan, untuk semua variabel menunjukkan adanya perbedaan di
antara kabupaten/kota pada ketiga klaster yang terbentuk. Hal ini dengan ditunjukkan dengan nilai
sig = 0,000.
Tabel 8 Number of Cases in each Cluster

Jumlah anggota masing-masing klaster yang terbentuk
dapat diketahui dari tabel di atas. Dari tabel tersebut, dapat
dilihat bahwa klaster-1 beranggotakan 21 kabupaten/kota,
klaster-2 berisi 12 kabupaten/kota, dan pada klaster-3
terdapat 2 kabupaten/kota. Berikut adalah tabel yang
menunjukkan kabupaten/kota mana saja yang masuk ke dalam
klaster 1, 2, ataupun 3.
Tabel 9 Hasil Clustering Menggunakan Algoritma K-Means

Cluster 1
QCL_2
Cluster 2
QCL_2
Cluster 3
QCL_2
(1)
(2)
(3)
(4)
(5)
(6)
Cilacap
0,65404
Sukoharjo
0,48447
Grobogan
0,44868
Banyumas
1,21576
Karanganyar
0,95766
Blora
0,44868
Purbalingga
1,01994
Kudus
0,53191
Banjarnegara
1,12144
Jepara
1,3491
Kebumen
1,75996
Semarang
1,15125
Purworejo
1,13201
Tegal
0,99708
Wonosobo
2,86353
Kota Magelang
0,61207
Magelang
0,95916
Kota Surakarta
1,08426
Boyolali
1,73322
Kota Salatiga
0,78721
Klaten
2,6144
Kota Semarang
1,34156
Wonogiri
0,97717
Kota Pekalongan
0,92186
Sragen
1,3864
Kota Tegal
0,81671
Rembang
1,68831
Pati
1,1944
Demak
1,24212
Temanggung
1,19935
Kendal
0,99843
Batang
1,80709
Pekalongan
1,33859
Pemalang
1,38683
Brebes
0,82133
Tabel di atas dapat ditafsirkan sebagai berikut :

Klaster-1: berisikan Kab. Cilacap, Kab. Banyumas, Kab. Purbalingga, Kab. Banjarnegara, Kab.
Kebumen, Kab. Purworejo, Kab. Wonosobo, Kab. Magelang, Kab. Boyolali, Kab. Klaten, Kab.
Wonogiri, Kab. Sragen, Kab. Rembang, Kab. Pati, Kab. Demak, Kab. Temanggung, Kab. Kendal, Kab.
Batang, Kab. Pekalongan, Kab. Pemalang, dan Kab.Brebes dengan masing-masing jarak terhadap
pusat klaster-1 tercantum dalam kolom 2.
Klaster-2: berisikan Kab. Sukoharjo, Kab. Karanganyar, Kab. Kudus, Kab. Jepara, Kab. Semarang, Kab.
Tegal, Kota Magelang, Kota Surakarta, Kota Salatiga, Kota Semarang, Kota Pekalongan, dan Kota
Tegal dengan masing-masing jarak terhadap pusat klaster-2 tercantum dalam kolom 4.
Klaster-3: berisikan Kab. Grobogan, Kab. Bloro dengan masing-masing jarak terhadap pusat klaster-3
tercantum dalam kolom 6.
BAB III PENUTUP

Dari hasil di atas, dapat ditarik kesimpulan sebagai berikut.
1. Kabupaten/Kota di Jawa Tengah dikelompokkan ke dalam 3 klaster, yaitu:
Klaster pertama berisi kabupaten/kota menengah yang anggotanya berjumlah 21

Kab/Kota, yaitu: Kab. Cilacap, Kab. Banyumas, Kab. Purbalingga, Kab. Banjarnegara,
Kab. Kebumen, Kab. Purworejo, Kab. Wonosobo, Kab. Magelang, Kab. Boyolali, Kab.
Klaten, Kab. Wonogiri, Kab. Sragen, Kab. Rembang, Kab. Pati, Kab. Demak, Kab.
Temanggung, Kab. Kendal, Kab. Batang, Kab. Pekalongan, Kab. Pemalang, dan
Kab.Brebes
Klaster kedua berisi kabupaten/kota besar (maju) yang anggotanya berjumlah 12

Kab/Kota, yaitu Kab. Sukoharjo, Kab. Karanganyar, Kab. Kudus, Kab. Jepara, Kab.
Semarang, Kab. Tegal, Kota Magelang, Kota Surakarta, Kota Salatiga, Kota Semarang,
Kota Pekalongan, dan Kota Tegal
Klaster ketiga berisi kabupaten/kota kecil (terbelakang) yang anggotanya berjumlah

2 Kab/Kota, yaitu Kab. Grobogan dan Kab. Bloro
2. Penggunaan algoritma hierarchical clustering (average linkage) dan nonhierarchical

clustering (k-means) dalam hal ini menghasilkan klaster yang anggotanya sama.
3. Rekomendasi arah kebijakan pemerintah yang dapat diambil adalah sebagai berikut.
Pemerintah Jawa Tengah seharusnya memfokuskan pemberantasan kemiskinan di

Kabupaten Grobogan dan Blora dengan cara meningkatkan pembangunan sarana
dan prasarana umum di daerah tersebut seperti pembangunan sarana air bersih,
dan sanitasi.
Pemerintah Jawa Tengah dapat memfokuskan pemberantasan kemiskinan di Kab.

Cilacap, Kab. Banyumas, Kab. Purbalingga, Kab. Banjarnegara, Kab. Kebumen, Kab.
Purworejo, Kab. Wonosobo, Kab. Magelang, Kab. Boyolali, Kab. Klaten, Kab.
Wonogiri, Kab. Sragen, Kab. Rembang, Kab. Pati, Kab. Demak, Kab. Temanggung,
Kab. Kendal, Kab. Batang, Kab. Pekalongan, Kab. Pemalang, dan Kab.Brebes dengan
cara menciptakan lapangan pekerjaan ataupun pengadaan pelatihan kerja agar
pendapatan rumah tangga di kabupaten/kota tersebut bisa membaik.
Untuk kabupaten/kota yang belum disebutkan di atas (klaster 2), Pemerintah dapat
meneliti lebih lanjut faktor-faktor apa yang menyebabkan kabupaten/kota tersebut
lebih maju dari pada kabupaten/kota lainnya agar hasilnya dapat digunakan untuk
referensi pembangunan di kabupaten/kota lain yang belum maju.
DAFTAR PUSTAKA
Abdillah, Ricky. 2011. Pengelompokan Kabupaten/Kota Berdasarkan Ukuran Kemiskinan

Nonmoneter di Jawa Tengah (Analisa Data Susenas Juli 2008). Jakarta: Sekolah Tinggi Ilmu
Statistik.
Badan Pusat Statistik. 2014. Statistik Indonesia 2014. Jakarta: Badan Pusat Statistik.
http://www.bps.go.id/Subjek/view/id/23, diakses pada 5 Mei 2015 21:00 WIB
http://www.slideshare.net/miraclemin1/4-kemiskinan-ketimpangan-dan-pembangunan,
diakses
pada 5 Mei 2015 21:00 WIB

https://www.academia.edu/5263304/Masalah_dan_Strategi_Pengentasan_Kemiskinan_di_Indonesi
a_, diakses pada 5 Mei 2015 21:00 WIB
Kaur, Manpreet dan Usvir Kaur. 2013. Comparison Between K-Mean and Hierarchical Algorithm
Using Query Redirection. Punjab: Sri Guru Granth Sahib World University.
Langgeni, Diah Pudi, ZK. Abdurahman Baizal, dan Yanuar Firdaus A.W. 2010. Clustering Artikel Berita
Berbahasa Indonesia Menggunakan Unsupervised Feature Selection. Bandung: Institut
Teknologi Telkom.
Steinbach, Michael, George Karypis, dan Vipin Kumar. 2000. A Comparison of Document Clustering
Techniques. Minesota: University of Minnesota.
Wicaksana, I Made Kunta dan I Made Widiartha. 2012. Penerapan Metode Ant Colony Optimzation
Pada Metode K-Harmonic Means Untuk Klasterisasi Data. Bali: Universitas Udayana.

Analisa Perbandingan Metode Hierarchical Clustering Dan Nonhierarchical Clustering

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Analisa Perbandingan Metode Hierarchical Clustering Dan Nonhierarchical Clustering

Enviado por

Direitos autorais:

Formatos disponíveis

Data Mining and Knowledge Management

Analisa Perbandingan Metode Hierarchical Clustering dan Nonhierarchical

Eko Wahyu Lestari

Galang Retno Winarko

Putu Agus Darmawan

SEKOLAH TINGGI ILMU STATISTIK

membandingkannya dengan algoritma klastering nonhierarki K-means.

1.3 Konsep dan Definisi

2 recall (i, j ) precision(i, j )

2.2 Sumber Data

Ukuran Kemiskinan Moneter

Ukuran Kemiskinan Nonmoneter

Sumber: Skripsi Ricky Abdillah (2011)

Tabel 3 Agglomeration Schedule

Tabel 4 Cluster Membership

Gambar 1 Dendogram using Average Linkage (Between Group)

2.4 Nonhierarchy Clustering Menggunakan Algoritma K-Means

= (rata-rata P0 seluruh sampel) + (0,60332 x Standar Deviasi rata-rata P0)

Jadi rata-rata P0 yang berada pada klaster 1 adalah 21,606.

Tabel 8 Number of Cases in each Cluster

Tabel 9 Hasil Clustering Menggunakan Algoritma K-Means

Tabel di atas dapat ditafsirkan sebagai berikut :

BAB III PENUTUP

Klaster pertama berisi kabupaten/kota menengah yang anggotanya berjumlah 21

Klaster kedua berisi kabupaten/kota besar (maju) yang anggotanya berjumlah 12

Klaster ketiga berisi kabupaten/kota kecil (terbelakang) yang anggotanya berjumlah

2. Penggunaan algoritma hierarchical clustering (average linkage) dan nonhierarchical

Pemerintah Jawa Tengah seharusnya memfokuskan pemberantasan kemiskinan di

Pemerintah Jawa Tengah dapat memfokuskan pemberantasan kemiskinan di Kab.

Abdillah, Ricky. 2011. Pengelompokan Kabupaten/Kota Berdasarkan Ukuran Kemiskinan

pada 5 Mei 2015 21:00 WIB

Você também pode gostar