The financial analyst of an investment banking firm is
interest in identifying a group of firm that are prime target for takeover A marketing manager is interested in identifying similar cities that can be use for test marketing. The campaign manager for a political candidate is interested in identifying groups of voters who have similar views on importance issues CLUSTER ANALYSIS CLUSTER ANALYSIS Cluster Analysis adalah suatu teknik penggerombolan obyek (responden) sehingga terbentuk beberapa kelompok, disebut cluster, dimana obyek di dalam suatu cluster lebih mirip dibandingkan antar cluster. Kemiripan ini sudah didasarkan pada sekumpulan variabel secara simultan.
KEGUNAAN identifikasi banyaknya cluster dari sekumpulan obyek identifikasi karakteristik setiap cluster prediksi jumlah anggota masing-masing subpopulasi berdasarkan perhitungan anggota setiap cluster yang diperoleh dari data sampel
CLUSTER ANALYSIS (1) Ukuran kemiripan Ukuran jarak yang sering digunakan adalah jarak euclidean (d) 2 21 22 2 11 12 2 1 ) ( ) ( ) , ( X X X X P P d ) ( )' ( ...... ) ( ) ( ) , ( x y x y x y x y x y d 2 2 2 2 1 1 (2) Asumsi Analisis Gerombol Data antar pengamatan (case) independen Sampel diambil secara random Antar variabel saling bebas (tidak berkorelasi) Data untuk seluruh variabel minimal memiliki skala interval (terutama bila ukuran kemiripan yang digunakan adalah jarak) CLUSTER ANALYSIS Metode analisis : 1) Hirarki (berjenjang) : - Banyak kelompok belum diketahui - Output berupa dendogram - pemotongan : jarak lompatan terjauh
2) Tidak Berhirarki : - Banyak kelompok ditentukan terlebih dahulu (diketahui) - Output : anggota kelompok dan centroid CLUSTER ANALYSIS Hirarki (berjenjang) Metode yang sering digunakan untuk pengelompokan obyek pada Hierarchical clustering adalah metode penggumpalan (agglomeratif). Terdapat 3 metode yang sering dipergunakan untuk perhitungan jarak antar cluster dengan obyek atau dengan cluster lain di dalam penggerombolan berjenjang, yaitu single lingkage (pautan tunggal), complete linkage (pautan lengkap) dan evarage linkage (pautan rata-rata). CLUSTER ANALYSIS Hirarki (berjenjang) Output : berupa dendrogram Z K Kalau sample size besar, misal 500, bagaimana? CLUSTER HIRARKI APLIKASI
Suatu penelitian di bidang MSDM ingin melakukan pemetaan terhadap karakteristik karyawan. Bilamana hasil pemetaan ini sudah diperoleh, maka program pembinaan dan pengembangan akan dapat dilakukan dengan lebih efektif. Keseluruhan karyawan pada bagian operasional (misalnya) sebanyak 70 orang. Terdapat tiga variabel yang diukur, yaitu Pengembangan Karir, Kepuasan Kerja dan Kinerja. Variabel tersebut dikukur menggunakan instrumen penelitian berupa daftar isian (angket)
Instrumen Penelitian
Lingkari salah satu angka (jawaban) yang Saudara anggap paling sesuai dengan pendapat dan sikap Saudara, dengan bobot penilaian sbb :
1. sangat tidak setuju, 2. tidak setuju, 3. Netral, 4. setuju, 5. sangat setuju
Pengembangan Karier (X1)
Skor Pilihan 1 Tingkat kemampuan karyawan oleh atasan digunakan sebagai dasar promosi jabatan 1 2 3 4 5 2 Daftar urutan kepangkatan (DUK) adalah tepat digunakan untuk syarat promosi jabatan karyawan (naik jabatan). 1 2 3 4 5 3 Pimpinan memberi penghargaan terhadap prestasi bapak/ibu. 1 2 3 4 5 Kepuasan Kerja Karyawan (Y1) 1 Tugas/jabatan yang sedang bapak/ibu jalani menyenangkan. 1 2 3 4 5 2 Lingkungan kerja bapak/ibu kondusif 1 2 3 4 5 3 Lingkungan kerja bapak/ibu menyenangkan. 1 2 3 4 5 4 Rekan sekerja bapak/ibu saling mendukung pelaksanaan tugas yang sedang bapak/ibu jalani. 1 2 3 4 5 Kinerja Karyawan (Y2) 1 Bapak/ibu dapat menyelesaikan tugas dengan tingkat kesalahan yang rendah 1 2 3 4 5 2 Setiap hari bapak/ibu berusaha menyeleseikan tugas pada hari itu juga, tidak menunggu hari esok. 1 2 3 4 5 3 Bila meninggalkan kantor pada jam kerja untuk kepentingan pribadi, Bapak/ibu meminta ijin kepada atasan. 1 2 3 4 5 4 Beban pekerjaan yang diberikan kepada Bapak/ibu selalu dapat diselesaikan sesuai dengan target. 1 2 3 4 5 DATA dalam software SPSS
Agglomeration Schedule Stage Cluster Combined Coefficients Stage Cluster First Appears Next Stage Cluster 1 Cluster 2 Cluster 1 Cluster 2 1 52 54 .000 0 0 2 2 31 52 .000 0 1 15 3 44 49 .000 0 0 36 . . . . . . . . . . . . . . . . . . . . . 61 4 28 .816 52 48 67 62 11 38 1.149 55 0 65 63 8 12 1.209 59 0 67 64 1 3 1.298 57 58 66 65 2 11 1.343 60 62 69 66 1 6 1.520 64 53 68 67 4 8 1.632 61 63 68 68 1 4 2.642 66 67 69 69 1 2 3.572 68 65 0 Output SPSS: Cluster Membership Case 3 Clusters 1 1 2 2 3 1 4 3 5 1 6 1 60 2 61 1 62 1 63 1 64 3 65 3 66 1 67 2 68 3 69 3 70 3 Coefficients pada Agglomeration schedule menunjukkan bahwa selisih terbesar terjadi antara stage 68 dengan 67. Sehingga banyaknya cluster yang optimal adalah 70 - 67 = 3 cluster. Dalam hal ini angka 70 adalah besar sampel dan 67 adalah stage terendah dari selisih koefisien terbesar. Report Cluster Rerata Skor P.Karir Rerata Skor Kepuasan Kerja Rerata Skor Kinerja 1 Mean 3.81 2.22 3.99 n 38 38 38 2 Mean 2.20 2.45 4.23 n 10 10 10 3 Mean 3.09 2.33 2.95 n 22 22 22 Output SPSS: Cluster 1 (kelompok karyawan yang masuk dalam gerombol 1 adalah 38 orang), bercirikan pengembangan karinya tertinggi, kepuasan kerjanya terendah dan kinerjanya sedang. Cluster 2 (beranggotakan 10 orang) bercirikan pengembangan karinya rendah, kepuasan kerjanya paling tinggi dan kinerja juga tertinggi. Cluster 3 pengembangan karirnya relatif tinggi, demikian juga kepuasan kerjanya, namun kinerjanya adalah terendah. Secara teoretis, tentunya berbeda cara empowering karyawan pada cluster 1, 2, dan cluster 3. CLUSTER NON HIRARKI APLIKASI
Aplikasi di bidang Ekonomi, ingin mengelompokkan provinsi berdasar indikator kesejahteraan 8 Indikator : 1. Indeks Pembangunan Manusia (HDI) 2. Produk Domestik Regional Bruto (PDRB) 3. Indeks Kemiskinan (IK) 4. Anggaran Pendapatan dan Belanja Daerah (APBD) 5. Angka Partisipasi Kasar untuk Tingkat SD (APSD) 6. Angka Partisipasi Kasar untuk Tingkat SLTP (APSLTP) 7. Tingkat Drop Out SD (DOSD) 8. Tingkat Drop Out SLTP (DOSLTP) Pemetaan ini dilakukan dengan cara ditetapkan 2 kelompok provinsi
CLUSTER NON HIRARKI APLIKASI
CLUSTER NON HIRARKI HASIL ANALISIS Terdapat 3 provinsi di Cluster 1, dan 25 propinsi di Cluster 2
Final Cluster Center s 69.20 63.86 6372.33 1515.28 6.76 16.11 622.91 492.83 97.23 94.44 87.40 78.45 2.43 4.10 9.30 16.10 HDI PDRB IK APBD APSD APSLTP DOSD DOSLTP 1 2 Cluster Number of Cases in each Cluster 3.000 25.000 28.000 .000 1 2 Cluster Valid Missing
HASIL ANALISIS ANOVA 76.267 1 9.563 26 7.975 .009 63190194.48 1 496245.953 26 127.336 .000 233.780 1 26.646 26 8.774 .006 45321.823 1 47066.210 26 .963 .335 20.846 1 10.344 26 2.015 .168 214.330 1 39.172 26 5.471 .027 7.437 1 2.273 26 3.271 .082 123.843 1 40.549 26 3.054 .092 HDI PDRB IK APBD APSD APSLTP DOSD DOSLTP Mean Square df Cluster Mean Square df Error F Sig. The F tests should be used only f or descriptive purposes because the clusters have been chosen to maximize the dif f erences among cases in dif f erent clusters. The observed signif icance levels are not corrected f or this and thus cannot be interpreted as tests of the hypothesis that the cluster means are equal. CLUSTER NON HIRARKI HASIL ANALISIS Cluster 1 berisi provinsi Riau, DKI, dan Kaltim (KAYA & MAJU). sedangkan pada Cluster 2, terdiri atas Aceh, Sumut, Sumbar, Jambi, Sumsel, Bengkulu, Lampung, Jabar, Jateng, Yogya, Jatim, Kalbar, Kalteng, Kalsel, Sulut, Sulteng, Sulsel, Sultra, Bali, NTB, NTT, Maluku, Irja, Malut, dan Banten (BIASA & KURANG MAJU) Berdasarkan hasil ANOVA, yang membedakan kedua kelompok adalah indikator HDI, PDRB, IK, dan APSLTP TERIMA KASIH