Escolar Documentos
Profissional Documentos
Cultura Documentos
Disusun Oleh:
(12.7121)
(12.7151)
Lukman Azhari
(12.7225)
(12.7315)
Kelas 3KS2
BAB I PENDAHULUAN
1.1 Latar Belakang
Kemiskinan merupakan suatu masalah yang terjadi di berbagai negara, terutama di negaranegara berkembang, termasuk Indonesia. Menurut Badan Pusat Statistik (BPS 2015), kemiskinan
adalah ketidakmampuan dari sisi ekonomi untuk memenuhi kebutuhan dasar makanan dan bukan
makanan yang diukur dari sisi pengeluaran. Kemiskinan sering kali disebut-sebut sebagai inti dari
masalah pembangunan di suatu daerah sehingga keberadaan data tentang kemiskinan tersebut
dirasa penting karena menyangkut arah dan tujuan pembangunan di suatu daerah. Secara
internasional, terdapat kesepakatan untuk menanggulangi kemiskinan yang tertuang dalam program
Millennium Development Goals (MDGs) butir pertama. Jika dilihat dari jumlah penduduk miskin,
Provinsi Jawa Tengah merupakan provinsi kedua yang jumlah penduduk miskinnya paling banyak,
yaitu sekitar 4,7 juta atau sekitar 16,48% dari jumlah penduduk miskin di Indonesia. Namun, jika
dilihat dari persentase penduduk miskin di Indonesia, Provinsi Jawa Tengah menempati posisi ke-10,
yaitu sebesar 14,44% (BPS, September 2013).
Karena pentingnya data tentang kemiskinan tersebut, perlu kiranya untuk mengelompokkan
daerah-daerah (dalam hal ini Kabupaten/Kota di Provinsi Jawa Tengah) berdasarkan ukuran
kemiskinan (Head Count Index, Poverty Gap Index, dan Poverty Severity Index) agar dapat diketahui
dengan cepat daerah mana saja yang perlu diberikan perhatian lebih dalam hal pengentasan dan
penanggulangan kemiskinan. Dalam hal ini, penulis bermaksud untuk mengelompokkan daerahdaerah
tersebut
menggunakan
algoritma
klastering
hierarki
Average
Linkage
dan
BAB II PEMBAHASAN
2.1 Kajian Teori
Metode Pengelompokan Hirarki
Metode pengelompokan hirarki digunakan apabila belum ada informasi jumlah
kelompok. Biasanya, hasil dari pengelompokan dengan metode ini adalah dendogram.
Metode Pengelompokan Nonhirarki
Metode pengelompokan nonhirarki bertujuan mengelompokkan n objek ke dalam k
kelompok (k<n). Salah satu prosedur pengelompokan dengan metode ini adalah KMeans. Algoritma K-Means adalah metode clustering berbasis jarak yang membagi data
ke dalam sejumlah klaster. Algoritma ini hanya dapat digunakan pada atribut numerik.
Ada banyak cara yang dapat digunakan untuk membandingkan performa dari algoritma KMeans dan algorima hierarki dalam penclusteran, tergantung dari ukuran apa yang digunakan.
Salah satu ukuran yang dapat digunakan dalam membandingkan algoritma tersebut adalah
dengan melihat nilai entropi dan nilai F Measure (yang dihitung dari nilai recall dan precision).
Entropi
Entropi memanfaatkan probabilitas dari klaster yang terbentuk yang dihitung dengan
rumus
n
E j Pij LogPij
i 1
di mana
Pij = probabilitas suatu anggota di klaster j untuk masuk ke cluster i.
Entropi dapat digunakan sebagai ukuran yang menunjukkan kualitas dari hasil clustering
(dengan catatan entropi yang terbaik terjadi saat setiap klaster memiliki tepat satu titik/data).
Nilai entropi yang lebih kecil menghasilkan klaster yang lebih bagus kualitasnya.
F Measure
F measure memanfaatkan ide presisi dan recall pada information retrieval, di mana setiap
klaster diperlakukan seolah-olah seperti hasil dari query dan masing-masing kelas seolaholah adalah set yang diinginkan dokumen untuk query, dengan rumus
recall (i, j )
nij
ni
precision(i, j )
nij
nj
di mana
n = jumlah anggota klaster
F Measure dihitung dengan rumus
F (i, j )
Nilai recall dan precision pada suatu keadaan dapat memiliki bobot yang berbeda. Ukuran
yang menampilkan timbal balik antara recall dan precision adalah F-measure yang merupakan
bobot rata-rata harmonik dari recall dan precision. Semakin besar nilai F-Measure, semakin baik
kualitas klaster tersebut.
Pada saat jumlah data meningkat, kinerja algoritma hirarki berjalan menurun dan waktu
untuk eksekusi meningkat. Waktu eksekusi algoritma K-Means juga meningkat tetapi jika
dibandingkan dengan algoritma hirarki kinerjanya lebih baik. Sebagai kesimpulan umum ,
algoritma K-Means baik untuk dataset yang besar dan hirarkis baik untuk dataset kecil .
Perbandingan antara algoritma ini dapat diimplementasikan atas dasar normalisasi, dengan
mengambil data yang dinormalisasi dan data yang tidak dinormalisasi akan memberikan hasil
yang berbeda .Tidak ada konsensus yang jelas dari dua algoritma ini yang dapat menghasilkan
pengelompokan yang lebih baik.
Kabupaten/Kota
(1)
P0
P1
P2
P0*
P1*
P2*
(2)
(3)
(4)
(5)
(6)
(7)
Cilacap
21,3992
4,6727
1,3493
27,0558
13,7432
9,2395
Banyumas
22,9347
3,9484
0,9254
21,5845
9,5646
5,5311
Purbalingga
27,2908
5,3969
1,4885
26,5569
12,0025
7,5713
Banjarnegara
23,3406
5,7536
1,7193
31,9548
15,5654
10,1228
Kebumen
27,8737
7,0504
2,0473
22,0945
10,2846
6,1921
Purworejo
18,2223
4,1724
1,2146
17,2864
8,6210
5,6476
Wonosobo
27,7216
8,0687
2,8595
23,9390
9,2457
5,4481
Magelang
16,4889
5,0090
1,6948
21,8843
10,3929
6,4720
Boyolali
17,0762
3,6425
1,0149
32,4205
16,1113
10,4927
Klaten
21,7152
7,0936
2,5033
9,8069
2,7721
2,0764
Sukoharjo
12,1273
2,6338
0,7348
7,4471
3,0411
1,8631
Wonogiri
20,7108
6,0289
2,0555
24,4091
11,2168
7,1206
Karanganyar
15,6848
3,0155
0,7806
6,1175
1,8793
0,8686
Sragen
20,8341
3,4997
0,8460
26,8496
12,4314
7,9593
Grobogan
19,8351
4,4859
1,2319
58,2478
29,7677
19,6901
Blora
18,7922
5,1251
1,6115
64,7850
31,6278
20,8122
Rembang
27,2082
5,4754
1,4258
36,5165
17,0610
10,8962
Pati
17,9042
6,0099
2,0839
23,0363
11,6377
7,8362
Kudus
12,5799
5,7580
0,7052
6,0799
1,7488
0,7855
Jepara
11,0504
1,9916
0,4605
17,7879
8,2205
5,3200
Demak
21,2423
3,8609
0,8807
22,1639
9,7753
5,9686
Semarang
11,3729
2,3284
0,6537
17,2681
7,1223
4,2718
Temanggung
16,394
4,6622
1,5002
22,8160
7,9433
4,2502
Kendal
17,8684
4,0242
1,2336
26,5598
12,1225
7,5475
Batang
18,0824
5,4126
1,9274
32,8894
18,0746
12,9430
Pekalongan
19,5191
4,2270
1,0227
16,0557
7,4132
4,6654
Pemalang
23,9151
3,5898
0,8470
22,3749
10,8396
7,1295
Tegal
15,7832
2,6979
0,6786
12,9754
4,8037
2,4554
Brebes
25,9848
5,0560
1,3607
22,8626
10,4550
6,6121
Kota Magelang
11,1643
1,6758
0,4390
0,9312
0,2800
0,1290
Kota Surakarta
16,1259
2,7122
0,7511
0,4538
0,0920
0,0208
Kota Salatiga
8,4658
1,2831
0,3368
5,2759
1,7800
0,9657
Kota Semarang
5,9966
0,9900
0,2855
0,9749
0,2282
0,0861
Kota Pekalongan
10,2919
1,0311
0,1813
2,1577
0,6910
0,3111
Kota Tegal
11,2756
1,4195
0,2126
0,7955
0,2308
0,0762
Berdasarkan tabel di atas, dapat dilihat bahwa data sejumlah 35 obyek telah diproses tanpa
ada data yang hilang.
Tabel di atas merupakan hasil proses clustering dengan metode Average Linkage. Jarak antar
variabel diukur dengan jarak euclidean kemudian dilakukan pengelompokan. Pengelompokan
dilakukan secara bertingkat.
Pada stage 1, terbentuk 1 klaster yang beranggotakan sampel nomor 34 dan 35 dengan jarak
0,093 (terdapat dalam kolom Coefficients). Karena proses aglomerasi dimulai dari 2 obyek yang
terdekat, maka jarak tersebut adalah yang terdekat dari sekian kombinasi jarak 35 obyek yang ada.
Angka 6 pada kolom terakhir, Next Stage, berarti clustering selanjutnya dilakukan pada stage 6.
Demikian seterusnya dari stage 6 dilanjutkan ke stage 14 hingga ke stage terakhir.
Proses aglomerasi ini bersifat kompleks, khususnya perhitungan koefisien yang melibatkan
sekian banyak obyek dan terus bertambah. Proses aglomerasi pada akhirnya akan menyatukan
semua obyek menjadi satu klaster. Klaster yang terbentuk dapat dilihat pada tabel 4 dan
dendogramnya dapat dilihat di gambar 1.
Dari tabel 5 dapat disimpulkan bahwa proses iterasi dilakukan sebanyak 5 kali. Proses ini dilakukan
untuk mendapatkan klaster yang sesuai. Jarak minimum antar pusat klaster yang terjadi dari hasil
iterasi adalah 5,918.
Tabel 6 Final Cluster Centers
Berdasarkan tabel 6, dapat dketahui bahwa data di atas masih terkait dengan proses
standarisasi yang mengacu pada z-score dengan ketentuan sebagai berikut.
Nilai negatif (-) berarti data berada di bawah rata-rata total
Nilai positif (+) berarti data berada di atas rata-rata total.
Sedangkan rumus yang digunakan adalah
. (1)
di mana:
X = Rata-rata sampel dalam cluster
= Rata-rata populasi
Z = Nilai standardisasi
= Standar Deviasi
Misalnya, apabila ingin mengetahui rata-rata P0 (presentase penduduk yang berada di bawah garis
kemiskinan moneter) dalam klaster 1 (X), maka
X
Untuk klaster yang lain dapat dicari rata-rata nilai masing-masing variabel dengan cara yang sama.
Berdasarkan tabel 6, dengan ketentuan yang telah dijelaskan di atas, dapat didefinisikan
sebagai berikut.
a. Klaster 1
Dalam klaster 1 ini berisi kabupaten/kota dengan nilai P0, P1, dan P2 yang tinggi dan nilai
P0*, P1*, dan P2* sedang, artinya kabupaten/kota dalam klaster 1 berdasarkan ukuran moneter
mempunyai presentase penduduk berada di bawah garis kemiskinan (P0) yang tinggi, rata-rata
kesenjangan pengeluaran masing-masing penduduk miskin terhadap garis kemiskinan (P1)
yang tinggi, dan ketimpangan pengeluaran di antara penduduk miskin (P2) yang tinggi.
Dalam ukuran nonmoneter, klaster ini mempunyai persentase penduduk berada di
bawah garis kemiskinan (P0*) yang sedang, rata-rata kesenjangan pengeluaran masing-masing
penduduk miskin terhadap garis kemiskinan yang sedang (P1*), dan ketimpangan pengeluaran
di antara penduduk miskin (P2*) yang sedang juga. Dengan demikian, dapat diduga bahwa
klaster-1 ini merupakan pengelompokan dari kabupaten/kota menengah yang mempunyai
pendapatan ataupun pengeluaran perkapita rendah namun mempunyai akses sanitasi, air
bersih, dan ukuran nonmoneter lain yang cukup mudah.
b. Klaster 2
Dalam klaster 2 ini berisi kabupaten/kota dengan nilai P0, P1, dan P2 serta P0*, P1*, dan
P2* yang rendah, artinya kabupaten/kota dalam klaster 2 berdasarkan ukuran moneter
mempunyai presentase penduduk berada di bawah garis kemiskinan (P0) yang rendah, ratarata kesenjangan pengeluaran masing-masing penduduk miskin terhadap garis kemiskinan (P1)
yang rendah, dan ketimpangan pengeluaran di antara penduduk miskin (P2) yang rendah.
Berdasarkan ukuran nonmoneter, klaster ini mempunyai presentase penduduk berada
di bawah garis kemiskinan (P0*) yang rendah, rata-rata kesenjangan pengeluaran masingmasing penduduk miskin terhadap garis kemiskinan (P1*) yang rendah, dan ketimpangan
pengeluaran di antara penduduk miskin (P2*) yang rendah. Berdasarkan hal tersebut, klaster-2
ini diduga merupakan pengelompokan dari kabupaten/kota yang maju, yaitu yang mempunyai
pendapatan ataupun pengeluaran perkapita tinggi dan juga mempunyai akses sanitasi, air
bersih, dan lain-lain yang sangat mudah.
c. Klaster 3
Dalam klaster 3 ini berisi kabupaten/kota dengan nilai P0, P1, dan P2 yang sedang dan
nilai P0*, P1*, dan P2* yang tinggi. Artinya, kabupaten/kota dalam klaster 3 berdasarkan ukuran
moneter mempunyai presentase penduduk berada di bawah garis kemiskinan (P0) yang
sedang, rata-rata kesenjangan pengeluaran masing-masing penduduk miskin terhadap garis
kemiskinan (P1) yang sedang, dan ketimpangan pengeluaran di antara penduduk miskin (P2)
yang sedang.
Jika dilihat berdasarkan ukuran nonmoneter, klaster ini mempunyai presentase
penduduk berada di bawah garis kemiskinan (P0*) yang tinggi, rata-rata kesenjangan
pengeluaran masing-masing penduduk miskin terhadap garis kemiskinan (P1*) yang tinggi,
serta ketimpangan pengeluaran di antara penduduk miskin (P2*) yang tinggi. Klaster-3 ini
diduga merupakan pengelompokan dari kabupaten/kota kecil yang mempunyai pendapatan
ataupun pengeluaran perkapita sedang namun mempunyai akses sanitasi, air bersih, dan
sebagainya yang sulit.
Perlu diingat kembali, penamaan masing-masing klaster sangat bersifat subjektif tergantung
pada peneliti dengan mengacu pada tujuan penelitian. Tabel berikut ini merupakan tabel Anova
yang dapat digunakan untuk melihat perbedaan variabel pada klaster yang terbentuk. Dalam hal ini
dapat dilihat dari nilai F dan nilai probabilitas (sig) masing-masing variabel.
Tabel 7 ANOVA
Kesimpulannya adalah semakin besar nilai F dan (sig < 0,05), maka semakin besar perbedaan
variabel pada klaster yang terbentuk.
Berdasarkan tabel yang didapatkan, untuk semua variabel menunjukkan adanya perbedaan di
antara kabupaten/kota pada ketiga klaster yang terbentuk. Hal ini dengan ditunjukkan dengan nilai
sig = 0,000.
QCL_2
Cluster 2
QCL_2
Cluster 3
QCL_2
(1)
(2)
(3)
(4)
(5)
(6)
Cilacap
0,65404
Sukoharjo
0,48447
Grobogan
0,44868
Banyumas
1,21576
Karanganyar
0,95766
Blora
0,44868
Purbalingga
1,01994
Kudus
0,53191
Banjarnegara
1,12144
Jepara
1,3491
Kebumen
1,75996
Semarang
1,15125
Purworejo
1,13201
Tegal
0,99708
Wonosobo
2,86353
Kota Magelang
0,61207
Magelang
0,95916
Kota Surakarta
1,08426
Boyolali
1,73322
Kota Salatiga
0,78721
Klaten
2,6144
Kota Semarang
1,34156
Wonogiri
0,97717
Kota Pekalongan
0,92186
Sragen
1,3864
Kota Tegal
0,81671
Rembang
1,68831
Pati
1,1944
Demak
1,24212
Temanggung
1,19935
Kendal
0,99843
Batang
1,80709
Pekalongan
1,33859
Pemalang
1,38683
Brebes
0,82133
Klaster-2: berisikan Kab. Sukoharjo, Kab. Karanganyar, Kab. Kudus, Kab. Jepara, Kab. Semarang, Kab.
Tegal, Kota Magelang, Kota Surakarta, Kota Salatiga, Kota Semarang, Kota Pekalongan, dan Kota
Tegal dengan masing-masing jarak terhadap pusat klaster-2 tercantum dalam kolom 4.
Klaster-3: berisikan Kab. Grobogan, Kab. Bloro dengan masing-masing jarak terhadap pusat klaster-3
tercantum dalam kolom 6.
Untuk kabupaten/kota yang belum disebutkan di atas (klaster 2), Pemerintah dapat
meneliti lebih lanjut faktor-faktor apa yang menyebabkan kabupaten/kota tersebut
lebih maju dari pada kabupaten/kota lainnya agar hasilnya dapat digunakan untuk
referensi pembangunan di kabupaten/kota lain yang belum maju.
DAFTAR PUSTAKA
diakses