Você está na página 1de 43

ANALISIS CLUSTER

HIERARKI

GUSTI AYU RATNA DEWI


(12.7158)
IRMEI ULIDHA (12.7191)
MOH. HARDIANSYAH M
(12.7254)
ROSHAN FIKRI (12.7366)

PENGELOMPOKAN PROVINSI DI INDONESIA

BERDASARKAN
K I N E R J A P E M E R I N TA H D I S E K T O R P E N D I D I K A N

TAHUN 2014

CLUSTER ANALYSIS
Cluster analysis adalah suatu teknik analisis multivariate metode
interdependen, dengan tujuan meringkas data dengan penggerombolan
RESPONDEN sehingga terbentuk beberapa kelompok disebut cluster.
Kesuksesan ckuster : pengelompokan yang dibuat berbasis pada kesamaan
(similiarities) dan jaraknya disimiliarities.
Input yang diperlukan berupa ukuran kesamaan atau data dimana
kesamaan dapat dihitung.
Asumsi analisis gerombol:
Data antar pengamatan (case) independen
Sampel diambil secara random
Antar variabel saling bebas
Data untuk seluruh variabel minimal memiliki skala interval

UKURAN KETAKMIRIPAN
Dilihat dari ukuran jarak.
Ukuran jarak yang sering digunakan adalah jarak euclide. Yaitu:
Namun jarak euclide tidak memperhitungkan varians dalam
kelompok sehingga disempurnakan oleh jarak mahalanobis.
Dan masih ada ukuran jarak lainnya seperti jarak mikowski.

METODE ANALISIS
1. Hirarki :

METODE :

Terstruktur
Dapat ditelusuri penggerombolan suatu objek dengan objek lainnya Penggumpalan
Stabil
Pembagian
Banyak kelompok belum diketahui
Outut berupa dendogram
Pemotongan : jarak lompatan terjauh

2. Tidak berhirarki

Metode yang sering digunakan untuk pengelomokan


objek pada hierarchical clustering adalah metode
penggumpalan (aglomeatif). Terdapat 7 metode
pengelompokan aglomeratif yang sering digunakan
yaitu : single linkage, complete linkage, average
linkage, centroid, median, minimum variance, ward.

PROSES ANALISIS:
EUCLIDIAN
DISTANCE
SPSS
1
Memasukkan data kedalam dataset SPSS. Setiap variabel
dibuat bersesuaian (semakin tinggi nilai variabel maka
bernilai semakin buruk). Sehingga untuk APM, angka yang
dimasukkan adalah komplemen dari APM (100 APM)

2
Melakukan analisis cluster hierarchical melalui menu Analyze
Classify Hierarchical Cluster... sehingga muncul kotak dialog seperti
berikut:

3
Masukkan provinsi ke dalam kotak Label Cases by: untuk memberi
nama case ke-i sebagai provinsi. Kemudian masukkan variabel lainnya
ke dalam kotak Variables: dimana variabel tersebut yang akan
digunakan untuk mengelompokkan provinsi.

4
Klik kotak Plots sehingga muncul kotak dialog seperti di bawah. Centang
kotak Dendogram untuk menampilkan dendogram. Setelah itu klik
Continue

5
Klik kotak Method sehingga muncul kotak dialog seperti di bawah.
Pada Measure Interval, pilih Euclidian Distance, kemudian pada
Transform Value distance, pilih z-score untuk melakukan
standardisasi data.

6
Pada Cluster Method, terdapat tujuh pilihan metode.
Ketujuh metode akan digunakan satu-persatu. Misalnya
untuk Between Group Linkage, klik dan pilih Between
Group Linkage. Kemudian klik Continue.

7
Klik Ok sehingga muncul output pada jendela
baru.

PROSES ANALISIS:
MAHALANOBIS DISTANCE
RSTUDIO
Untuk persiapan, install package ecodist
terlebih dahulu (pastikan terkoneksi
internet). Untuk meng-install package ini
klik Tools Install Packages sehingga
muncul kotak dialog seperti dibawah.
Ketikkan ecodist dalam kotak Package
kemudian klik Install. Tunggu hingga
proses selesai.

Lakukan
import
data
melalui menu Tools
Import Dataset From
Text File (pastikan data
yang tersimpan dalam
format *.csv) sehingga
muncul kotak seperti di
bawah. Masukkan nama
dataset ke dalam kotak
Name, kemudian klik
Import.

Load
package
ecodist
dengan
mengetikkan
library(ecodist) ke dalam jendela console, kemudian
tekan enter.

Buka tab R Script dengan


menekan
Ctrl+Shift+N.
Masukkan kode di samping
kedalam kotak R Script
dan jalankan (tekan Ctrl+R
pada setiap line). Setiap
kali
akan
menjalankan
plot(fit), salin output pada
jendela
Plots
untuk
menyimpan
output
tersebut.

HASIL DAN
PEMBAHASAN

Statisti
k

RMG

ANPM

ABH

Mean

14,966

39,685

4,594

Median

14,360

40,000

2,480

2,829

6,140

5,418

SB

Untuk memilih metode


dan
jarak
terbaik,
dilakukan
perhitungan
simpangan baku antar
cluster maupun dalam
cluster. Cluster terbaik
yang
terbentuk
diharapkan
memiliki
simpangan baku antar
cluster sebesar mungkin
dengan simpangan baku
dalam
cluster
sekecil
mungkin.

EUCLIDIAN DISTANCE
Dengan menggunakan euclidian distance, dilakukan analisis
cluster hierarki. Pemilihan jumlah cluster didasarkan oleh
perbedaan jarak perubahan cluster terpanjang.

AVERAGE
LINKAGE
BETWEEN
GROUP

Statist
ik
Cluster
Mean
Media
n
SB
Cluster
Mean
Media
n
SB
Cluster
Mean
Media
n
SB
SB AC

RMG

ANPM

ABH

1
13,722 38,770

3,632

13,860 38,090
1,865
5,654
2
19,169 40,497

2,400
3,122
4,514

19,070 40,000 3,250


1,117
4,427
3,559
3
16,630 56,890 29,220
16,630 56,890 29,220
2,225
8,165 11,860

AVERAGE
LINKAGE
WITHIN GROUP

Statist
ik
Cluster
Mean
Media
n
SB
Cluster
Mean
Media
n
SB
Cluster
Mean
Media
n
SB
SB AC

RMG APNM
1
12,342 32,937
12,040 32,590
1,854 3,049
2
15,920 41,578

ABH
4,592
4,592
3,890
3,525

15,600 41,890 2,230


2,549 3,952 2,905
3
16,630 56,890 29,220
16,630 56,890 29,220
1,877 9,904 11,869

FURTHEST
NEIGHBOR
(COMPLETE
LINKAGE)

Statis
tik
RMG
Cluster 1
Mean 12,342
Media
n
12,040
SB
1,854
Cluster 2
Mean 19,710
Media
n
19,580
SB
0,741
Cluster 3
Mean 14,867
Media
n
14,455
SB
1,697
Cluster 4
Mean 16,630
Media

APNM

ABH

32,937 4,592
32,590 2,580
3,049 3,890
38,748 3,152
38,310 2,040
3,402 3,237
42,364 3,628
42,220 2,315
3,806 2,899
56,890 29,220

NEAREST
NEIGHBOR
(SINGLE
LINKAGE)

Statist
ik
Cluster
Mean
Media
n
SB
Cluster
Mean
Media
n
SB
Cluster
Mean
Media
n
SB
SB AC

RMG

APNM

ABH

1
14,867 39,470

3,708

14,310 40,000
2,893
5,159
2
16,370 29,170

2,400
3,166
7,440

16,370 29,170 7,440


3
16,630 56,890 29,220
16,630 56,890 29,220
0,777 11,440 11,250

MEDIAN
LINKAGE
With this method, the two clusters being
combined are weighted equally in the
computation of the centroid, regardless
of the number of cases in each.
This allows small groups to have an
equal effect on the characterization of
larger clusters into which they are
merged.

Statistik
Cluster 1
Mean
Median
SB
Cluster 2
Mean
Median
SB
Cluster 3
Mean
Median
SB
Cluster 4
Mean
Median
SB
Cluster 5
Mean
Median
SB
SB AC

RMG

APNM

ABH

13,726
13,895
1,831

38,268
37,890
4,654

3,385
2,315
3,051

19,169
19,070
1,117

40,497
40,000
4,427

4,514
3,250
3,559

16,370
16,370
-

29,170
29,170
-

7,440
7,440
-

12,355
12,355
1,534

49,095
49,095
1,428

4,440
4,440
4,610

16,630
16,630
2,384

56,890
56,890
9,484

29,220
29,220
9,803

CENTROID
LINKAGE
This method calculates the distance
between two clusters as the sum of
distances between cluster means for all
of the variables.
In the centroid method, the centroid of a
merged cluster is a weighted
combination of the centroids of the two
individual clusters, where the weights
are proportional to the sizes of the
clusters

Statis
tik
RMG
Cluster 1
Mean 14,861
Media
n
14,335
SB
2,622
Cluster 2
Mean 20,830
Media
n
20,830
SB
Cluster 3
Mean 10,580
Media
n
10,580
SB
Cluster 4
Mean 16,630
Media

APNM

ABH

39,228 3,357
39,545 2,315
5,538 2,622
40,000 8,640
40,000 8,640
35,890 13,040
35,890 13,040
56,890 29,220

WARD LINKAGE

Statis
tik
RMG APNM ABH
Cluster 1
12,34 32,93
Mean
2
7
4,592
Media 12,04 32,59
n
0
0
2,580
SB
1,851 3,049 3,890
Cluster 2
19,16 40,49
Mean
9
7
4,514
Media 19,07 40,00
n
0
0
3,250
SB
1,117 4,427 3,559
Cluster 3
14,49 42,05
Mean
9
1
3,092
Media 14,33 42,22
n
5
0
2,165
SB
1,396 3,780 2,580

PERBANDINGA
N
Simpangan baku antar cluster cukup
kecil dibandingkan dengan simpangan
baku data.
Metode yang justru membuat simpangan
baku dalam cluster menjadi lebih besar
terdapat pada metode single linkage
(pada vaiabel rasio murid guru).
Secara umum, simpangan baku antar
cluster dari metode average linkage
within group adalah yang terbesar.

Digunakan metode
average linkage within group
untuk mewakili

MAHALANOBIS DISTANCE
Dengan menggunakan mahalanobis distance, dilakukan analisis
cluster hierarki. Sama halnya dengan metode dengan euclidian
distance, pemilihan jumlah cluster ini juga didasarkan oleh
perbedaan jarak perubahan cluster terpanjang. Seluruh metode
yang digunakan yaitu dengan perhitungan hirarki aglomeratif.

Bayangkan
ada garis
imajiner ini

Bayangkan
ada garis
imajiner ini

SINGLE
LINKAGE

Statist
ik
Cluster
Mean
Media
n
SB
Cluster
Mean
Media
n
SB
Cluster
Mean
Media
n
SB
SB AC

RMG

APNM

ABH

1
16,630

56,890

29,220

16,630
2
16,370
16,370

56,890
-

29,220
-

29,170
29,170

7,440
7,440

3
14,867

39,470

3,708

14,310
2,846
0,777

40,000
5,075
11,440

2,400
3,114
11,250

AVERAGE
LINKAGE

Statis
tik
RMG
Cluster 1
Mean 16,630
Media
n
16,630
SB
Cluster 2
Mean 13,475
Media
n
13,475
SB
2,895
Cluster 3
Mean 15,010
Media
n
14,335
SB
2,781
SB AC 1,288

APNM

ABH

56,890 29,220
56,890 29,220
32,530 10,240
32,530 10,240
3,360 2,800
39,589 3,397
40,390 2,315
5,116 2,650
10,234 10,923

COMPLETE
LINKAGE

Statis
tik
RMG APNM ABH
Cluster 1
16,63 56,89 29,22
Mean
0
0
0
Media 16,63 56,89 29,22
n
0
0
0
SB
Cluster 2
13,36 45,54
Mean
8
7
2,992
Media 13,68 44,44
n
5
5
2,250
SB
1,011 2,631 2,162
Cluster 3
17,67 40,32
Mean
1
1
3,366
Media 17,53 40,78
n
0
0
2,230
SB
1,825 3,357 2,801

WARD LINKAGE

Statis
tik
RMG
Cluster 1
Mean 16,630
Media
n
16,630
SB
Cluster 2
Mean 13,368
Media
n
13,685
SB
1,011
Cluster 3
Mean 12,578
Media
n
12,570
SB
1,385
Cluster 4
Mean 17,578
Media

APNM

ABH

56,890 29,220
56,890 29,220
45,547 2,992
44,445 2,250
2,631 2,162
35,508 4,438
35,640 2,530
3,989 3,647
39,525 3,657

PERBANDINGA
N
Terdapat metode yang justru membuat
simpangan baku dalam cluster menjadi
lebih besar, yaitu pada metode single
linkage (pada vaiabel rasio murid guru)
dan average linkage (juga pada rasio
murid guru).
Secara umum, simpangan baku antar
cluster dari metode single lingkage
adalah yang terbesar namun simpangan
baku dalam clusternya cukup besar.

Dipilih metode
complete linkage (hirarki
aglomeratif).
Untuk mewakili

AVERAGE LINKAGE
Within Group
(Euclidian Distance)

dipilih metode
complete
linkage
(mahalanobis
distance)
untuk
mengelompokka
n provinsi
berdasarkan
kinerja
pemerintah di
sektor
pendidikan tahun
2014.

Statis
tik
Cluster
Mean
Media
n
SB
Cluster
Mean
Media
n
SB
Cluster
Mean
Media
n
SB
SB AC

RMG APNM
1
12,342 32,937
12,040 32,590
1,854 3,049
2
15,920 41,578

ABH
4,592
4,592
3,890
3,525

15,600 41,890 2,230


2,549 3,952 2,905
3
16,630 56,890 29,220
16,630 56,890 29,220
1,877 9,904 11,869

COMPLETE LINKAGE
(Mahalanobis
Statist
Distance)
ik
RMG APNM
ABH
Cluster 1
Mean
16,630 56,890 29,220
Media
n
16,630 56,890 29,220
SB
Cluster 2
Mean
13,368 45,547 2,992
Media
n
13,685 44,445 2,250
SB
1,011
2,631
2,162
Cluster 3
Mean
17,671 40,321 3,366
Media
n
17,530 40,780 2,230
SB
1,825
3,357
2,801
Cluster 4
Mean
12,870 35,021 4,668
Media
n
12,630 35,390 2,580
SB
1,671
4,188
3,594

PENUTUP

KESIMPULAN

dipilih metode
complete linkage (mahalanobis
distance)
untuk mengelompokkan provinsi
berdasarkan kinerja pemerintah di
sektor pendidikan tahun 2014.

Kelompok 1: Papua.
Kelompok 2: Kepulauan Bangka Belitung,
Banten, Kalimantan Barat, Kalimantan
Tengah, Kalimantan Selatan, dan Gorontalo.
Kelompok 3: Sumatera Utara, Jambi,
Sumatera Selatan, Lampung, DKI Jakarta,
Jawa Barat, Jawa Tengah, Jawa Timur, Nusa
Tenggara Timur, Sulawesi Utara, Sulawesi
Tengah, Maluku, dan Papua Barat.
Kelompok 4: Aceh, Sumatera Barat, Riau,
Bengkulu, Kepulauan Riau, Bengkulu, Riau,
DI Yogyakarta, Bali, Nusa Tenggara Barat,
Kalimantan Timur, Sulawesi Selatan,
Sulawesi Tenggara, Sulawesi Barat, dan
Maluku Utara.

SARAN
Statistik
Cluster 1
Mean
Median
SB
Cluster 2
Mean
Median
SB
Cluster 3
Mean
Median
SB
Cluster 4
Mean
Median
SB
SB AC

RMG

APNM

ABH

16,630
16,630
-

56,890
56,890
-

29,220
29,220
-

13,368
13,685
1,011

45,547
44,445
2,631

2,992
2,250
2,162

17,671
17,530
1,825

40,321
40,780
3,357

3,366
2,230
2,801

12,870
12,630
1,671
2,057

35,021
35,390
4,188
8,092

4,668
2,580
3,594
11,079

Dalam kasus ini, tidak hanya pada metode


complete linkage (mahalanobis distance), terlihat
bahwa Provinsi Papua membentuk kelompok
sendiri, dengan angka buta huruf dan tingkat
partisipasi sekolah yang paling buruk. Disarankan
agar Provinsi Papua mendapatkan perhatian
khusus dari pemerintah.
Fokus kebijakan yang dapat diberikan pada
kelompok lainnya yaitu:
Kelompok 2 sebagai kelompok dengan Angka Partisipasi
Murni SMA sederajat terkecil diharapkan lebih fokus untuk
meningkatkan angka partisipasi tersebut karena dinilai
masih kecil.
Kelompok 3 sebagai kelompok dengan rasio murid guru
terbesar diharapkan untuk lebih fokus meningkatkan jumlah
guru. Hal ini dimaksudkan agar pengawasan guru terhadap
murid dapat lebih efektif.
Kelompok 4 sebagai kelompok dengan angka buta huruf
terbesar diharapkan untuk lebih meningkatkan pendidikan
dasar ini. Sebab kemampuan baca tulis sangat
mempengaruhi kualitas pendidikan suatu daerah.

MAKASIH.

Você também pode gostar