Analisis Cluster

Consider the following scenarios:
The financial analyst of an investment banking firm is

interest in identifying a group of firm that are prime
target for takeover
A marketing manager is interested in identifying similar
cities that can be use for test marketing.
The campaign manager for a political candidate is
interested in identifying groups of voters who have
similar views on importance issues
CLUSTER ANALYSIS
CLUSTER ANALYSIS
Cluster Analysis adalah suatu teknik penggerombolan obyek (responden)
sehingga terbentuk beberapa kelompok, disebut cluster, dimana obyek di
dalam suatu cluster lebih mirip dibandingkan antar cluster. Kemiripan
ini sudah didasarkan pada sekumpulan variabel secara simultan.

KEGUNAAN
identifikasi banyaknya cluster dari sekumpulan obyek
identifikasi karakteristik setiap cluster
prediksi jumlah anggota masing-masing subpopulasi berdasarkan
perhitungan anggota setiap cluster yang diperoleh dari data sampel

CLUSTER ANALYSIS
(1) Ukuran kemiripan
Ukuran jarak yang sering digunakan adalah jarak euclidean (d)
2
21 22
2
11 12 2 1
) ( ) ( ) , ( X X X X P P d
) ( )' ( ...... ) ( ) ( ) , ( x y x y x y x y x y d
2
2 2
2
1 1
(2) Asumsi Analisis Gerombol
Data antar pengamatan (case) independen
Sampel diambil secara random
Antar variabel saling bebas (tidak berkorelasi)
Data untuk seluruh variabel minimal memiliki skala interval
(terutama bila ukuran kemiripan yang digunakan adalah jarak)
CLUSTER ANALYSIS
Metode analisis :
1) Hirarki (berjenjang) :
- Banyak kelompok belum diketahui
- Output berupa dendogram
- pemotongan : jarak lompatan terjauh

2) Tidak Berhirarki :
- Banyak kelompok ditentukan terlebih dahulu (diketahui)
- Output : anggota kelompok dan centroid
CLUSTER ANALYSIS
Hirarki (berjenjang)
Metode yang sering digunakan untuk pengelompokan obyek pada
Hierarchical clustering adalah metode penggumpalan
(agglomeratif).
Terdapat 3 metode yang
sering dipergunakan untuk
perhitungan jarak antar
cluster dengan obyek atau
dengan cluster lain di dalam
penggerombolan berjenjang,
yaitu single lingkage
(pautan tunggal), complete
linkage (pautan lengkap) dan
evarage linkage (pautan
rata-rata).
CLUSTER ANALYSIS
Hirarki (berjenjang)
Output : berupa dendrogram
Z
K
Kalau sample size besar, misal 500, bagaimana?
CLUSTER HIRARKI
APLIKASI

Suatu penelitian di bidang MSDM ingin melakukan pemetaan terhadap karakteristik
karyawan. Bilamana hasil pemetaan ini sudah diperoleh, maka program
pembinaan dan pengembangan akan dapat dilakukan dengan lebih efektif.
Keseluruhan karyawan pada bagian operasional (misalnya) sebanyak 70 orang.
Terdapat tiga variabel yang diukur, yaitu Pengembangan Karir, Kepuasan Kerja dan
Kinerja. Variabel tersebut dikukur menggunakan instrumen penelitian berupa daftar
isian (angket)

Instrumen Penelitian

Lingkari salah satu angka (jawaban) yang Saudara anggap paling sesuai dengan
pendapat dan sikap Saudara, dengan bobot penilaian sbb :

1. sangat tidak setuju, 2. tidak setuju, 3. Netral, 4. setuju, 5. sangat setuju

Pengembangan Karier (X1)

Skor Pilihan
1 Tingkat kemampuan karyawan oleh atasan digunakan sebagai dasar
promosi jabatan
1 2 3 4 5
2 Daftar urutan kepangkatan (DUK) adalah tepat digunakan untuk syarat
promosi jabatan karyawan (naik jabatan).
1 2 3 4 5
3 Pimpinan memberi penghargaan terhadap prestasi bapak/ibu. 1 2 3 4 5
Kepuasan Kerja Karyawan (Y1)
1 Tugas/jabatan yang sedang bapak/ibu jalani menyenangkan. 1 2 3 4 5
2 Lingkungan kerja bapak/ibu kondusif 1 2 3 4 5
3 Lingkungan kerja bapak/ibu menyenangkan. 1 2 3 4 5
4 Rekan sekerja bapak/ibu saling mendukung pelaksanaan tugas yang
sedang bapak/ibu jalani.
1 2 3 4 5
Kinerja Karyawan (Y2)
1 Bapak/ibu dapat menyelesaikan tugas dengan tingkat kesalahan yang
rendah
1 2 3 4 5
2 Setiap hari bapak/ibu berusaha menyeleseikan tugas pada hari itu juga,
tidak menunggu hari esok.
1 2 3 4 5
3 Bila meninggalkan kantor pada jam kerja untuk kepentingan pribadi,
Bapak/ibu meminta ijin kepada atasan.
1 2 3 4 5
4 Beban pekerjaan yang diberikan kepada Bapak/ibu selalu dapat
diselesaikan sesuai dengan target.
1 2 3 4 5
DATA dalam
software SPSS

Agglomeration Schedule
Stage
Cluster Combined
Coefficients
Stage Cluster First Appears
Next Stage Cluster 1 Cluster 2 Cluster 1 Cluster 2
1 52 54 .000 0 0 2
2 31 52 .000 0 1 15
3 44 49 .000 0 0 36
. . . . . . .
. . . . . . .
. . . . . . .
61 4 28 .816 52 48 67
62 11 38 1.149 55 0 65
63 8 12 1.209 59 0 67
64
1 3
1.298
57 58 66
65
2 11
1.343
60 62 69
66
1 6
1.520
64 53 68
67
4 8
1.632
61 63 68
68
1 4
2.642
66 67 69
69
1 2
3.572
68 65 0
Output SPSS:
Cluster Membership
Case 3 Clusters
1 1
2 2
3 1
4 3
5 1
6 1
60 2
61 1
62 1
63 1
64 3
65 3
66 1
67 2
68 3
69 3
70 3
Coefficients pada Agglomeration schedule menunjukkan bahwa selisih
terbesar terjadi antara stage 68 dengan 67. Sehingga banyaknya cluster
yang optimal adalah 70 - 67 = 3 cluster. Dalam hal ini angka 70 adalah
besar sampel dan 67 adalah stage terendah dari selisih koefisien terbesar.
Report
Cluster
Rerata Skor
P.Karir
Rerata Skor
Kepuasan Kerja
Rerata Skor
Kinerja
1
Mean 3.81 2.22 3.99
n 38 38 38
2
Mean 2.20 2.45 4.23
n 10 10 10
3
Mean 3.09 2.33 2.95
n 22 22 22
Output SPSS:
Cluster 1 (kelompok karyawan yang masuk dalam gerombol 1 adalah 38
orang), bercirikan pengembangan karinya tertinggi, kepuasan kerjanya
terendah dan kinerjanya sedang.
Cluster 2 (beranggotakan 10 orang) bercirikan pengembangan karinya rendah,
kepuasan kerjanya paling tinggi dan kinerja juga tertinggi.
Cluster 3 pengembangan karirnya relatif tinggi, demikian juga kepuasan
kerjanya, namun kinerjanya adalah terendah.
Secara teoretis, tentunya berbeda cara empowering karyawan pada cluster 1,
2, dan cluster 3.
CLUSTER NON HIRARKI
APLIKASI

Aplikasi di bidang Ekonomi, ingin mengelompokkan provinsi
berdasar indikator kesejahteraan 8 Indikator :
1. Indeks Pembangunan Manusia (HDI)
2. Produk Domestik Regional Bruto (PDRB)
3. Indeks Kemiskinan (IK)
4. Anggaran Pendapatan dan Belanja Daerah (APBD)
5. Angka Partisipasi Kasar untuk Tingkat SD (APSD)
6. Angka Partisipasi Kasar untuk Tingkat SLTP (APSLTP)
7. Tingkat Drop Out SD (DOSD)
8. Tingkat Drop Out SLTP (DOSLTP)
Pemetaan ini dilakukan dengan cara ditetapkan 2 kelompok provinsi

CLUSTER NON HIRARKI
APLIKASI

CLUSTER NON HIRARKI
HASIL ANALISIS
Terdapat 3 provinsi di Cluster 1, dan 25 propinsi di Cluster 2

Final Cluster Center s
69.20 63.86
6372.33 1515.28
6.76 16.11
622.91 492.83
97.23 94.44
87.40 78.45
2.43 4.10
9.30 16.10
HDI
PDRB
IK
APBD
APSD
APSLTP
DOSD
DOSLTP
1 2
Cluster
Number of Cases in each Cluster
3.000
25.000
28.000
.000
1
2
Cluster
Valid
Missing

HASIL ANALISIS
ANOVA
76.267 1 9.563 26 7.975 .009
63190194.48 1 496245.953 26 127.336 .000
233.780 1 26.646 26 8.774 .006
45321.823 1 47066.210 26 .963 .335
20.846 1 10.344 26 2.015 .168
214.330 1 39.172 26 5.471 .027
7.437 1 2.273 26 3.271 .082
123.843 1 40.549 26 3.054 .092
HDI
PDRB
IK
APBD
APSD
APSLTP
DOSD
DOSLTP
Mean Square df
Cluster
Mean Square df
Error
F Sig.
The F tests should be used only f or descriptive purposes because the clusters have been
chosen to maximize the dif f erences among cases in dif f erent clusters. The observed
signif icance levels are not corrected f or this and thus cannot be interpreted as tests of the
hypothesis that the cluster means are equal.
CLUSTER NON HIRARKI
HASIL ANALISIS
Cluster 1 berisi provinsi Riau, DKI, dan Kaltim (KAYA & MAJU).
sedangkan pada Cluster 2, terdiri atas Aceh, Sumut, Sumbar, Jambi,
Sumsel, Bengkulu, Lampung, Jabar, Jateng, Yogya, Jatim, Kalbar,
Kalteng, Kalsel, Sulut, Sulteng, Sulsel, Sultra, Bali, NTB, NTT, Maluku,
Irja, Malut, dan Banten (BIASA & KURANG MAJU)
Berdasarkan hasil ANOVA, yang membedakan kedua kelompok adalah
indikator HDI, PDRB, IK, dan APSLTP
TERIMA KASIH

Analisis Cluster

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Analisis Cluster

Enviado por

Direitos autorais:

Formatos disponíveis

Consider the following scenarios:

The financial analyst of an investment banking firm is

Você também pode gostar