Escolar Documentos
Profissional Documentos
Cultura Documentos
Oleh :
Abdullah M. Jaubah
Pendahuluan
Latihan ini merupakan latihan kesepuluh
terkandung dalam Correlate adalah prosedur Bivariate Correlation, Partial Correlation, dan
Distance. Prosedur korelasi bivariat dipakai untuk menghitung koefisien korelasi Pearson,
Sprearmans rho, dan Kendalls tau-b dengan tingkat-tingkat signifikan tertentu. Korelasi
dipakai untuk mengukur hubungan antara variabel-variabel atau hubungan menurut urutan
peringkat. Data harus dibersihkan dari outliers karena dapat menberikan hasil-hasil yang
mengandung kesalahan dan bukti dari suatu hubungan garis lurus. Koefisien korelasi Pearson
merupakan suatu ukuran asosiasi garis lurus. Dua variabel dapat berhubungan secara
sempurna, akan tetapi jika hubungan adalah tidak linear, maka koefisien korelasi Pearson
bukan merupakan statistik yang serasi untuk mengukur asosiasi. Prosedur korelasi parsial
ldipakai untuk menghitung koefisien-koefisien korelasi parsial yang mendeskripsikan
hubungan garis lurus antara dua variabel dan variabel kontrol dipakai untuk mengawasi
akibat-akibat dari satu atau lebih variabel tambahan.
hubungan sempurna akan tetapi jika hubungan itu tidak berbentuk garis lurus, maka koefisien
korelasi adalah tidak sesuai secara statistik untuk mengukur asosiasi. Prosedur ini dipakai
untuk menghitung berbagai ragam ukuran baik kesamaan atau ketidaksamaan (jarak) antara
pasangan variabel atan antara pasangan kasus. Ukuran kesamaan atau jarak ini dipakai
dengan prosedur lain seperti prosedur analisis faktor, analisis klaster, atau multidimensional
scaling, untuk membantu analisis atas data yang kompleks. Ketidaksamaan (jarak) dipakau
untuk mengukur data interval adalah Euclidean distance, squared Euclidean distance,
Chebychev, block, Minkowski, atau customized; untuk data kuantitatif, chi-square atau phisquare; untuk data biner, Euclidean distance, squared Euclidean distance, size difference,
pattern difference, variance, shape, atau Lance and Williams. Ukuran-ukuran kesamaan untuk
data interval adalah
Pearson correlation atau cosine; untuk data binary, Russel dan Rao,
simple matching, Jaccard, dice, Rogers dan Tanimoto, Sokal dan Sneath 1, Sokal dan Sneath
2, Sokal dan Sneath 3, Kulczynski 1, Kulczynski 2, Sokal dan Sneath 4, Hamann, Lambda,
1
Anderberg's D, Yule's Y, Yule's Q, Ochiai, Sokal dand Sneath 5, phi 4-point correlation, atau
dispersi.
Prosedur Bivariate Correlations dipakai untuk menghitung asosiasi berpasangan untuk
serangkaian variabel dan menyajikan hasil-hasil dalam suatu matriks. Prosedur Bivariate
Correlation bermanfaat untuk menentukan kekuatan dan arah dari asosiasi antara dua
variabel berjenis kuantitatif atau dua variabel berjenis ordinal.
Pemakaian Korelasi Untuk Melakukan Studi Asosiasi
Para engineer merancang mobil, agar penjualan meningkat, ingin memusatkan perhatian
mereka atas aspek-aspek dari mobil yang penting bagi para pelanggan, misalkan, peranan
penting dari efisiensi bahan bakar minyak dalam huhungannya dengan penjualan. Salah satu
cara untuk mengukur hal ini adalah menghitung korelasi antara penjualan masa lalu dan
efisiensi bahan bakar minyak.
Informasi mengenai
Korelasi bivariat dipakai untuk mengukur tingkat kepentingan dari efisiensi bahan bakar
minyak dan penjualan mobil.
Perintah Analyze > Correlate > Bivariate dipakai. Langkah ini akan menyajikan kotak dialog
Bivariate Correlations sebagai berikut :
2
Variabel Sales in thousands dan variabel Fuel efficiency dipilih sebagai variabel-variabel
analisis. Tombol OK ditekan. Langkah ini akan mencipta perintah sintaksis sebagai berikut :
GET
FILE='D:\SPSS22\car_sales.sav'.
CORRELATIONS
/VARIABLES=sales mpg
/PRINT=TWOTAIL NOSIG
/MISSING=PAIRWISE.
Prosedur ini menghasilkan matriks korelasi untuk penjualan dan mpg. Semua nilai dari
peluang lain ditetapkan sesuai dengan ketentuan.
Correlation Matrix
Correlations
Sales in thousands
Sales in thousands
Pearson Correlation
Sig. (2-tailed)
N
Fuel efficiency
Pearson Correlation
Fuel efficiency
-,017
,837
157
154
-,017
Sig. (2-tailed)
,837
154
154
Koefisien korelasi Pearson dipakai untuk mengukur asosiasi linear antarqa dua variabel
berjenis kuantitatif. Korelasi tercermin dalam tabel adalah negatif walau tidak secara
sifnifikan berbeda dari
0 karena nilai-p adalah 0.837 adalah lebih besar daripada nilai 0.10. Hal ini mengungkap
bahwa para perancang tidak harus memusatkan usaha-usaha mereka atas pembuatan mobil
yang lebih efisien dalam pemakaian bahan bakar minyak karena tidak mempunyai akibat
yang cukup besar pada penjualan. Koefisien korelasi Pearson bekerja terbaik jika variabelvariabel memenuhi persyaratan normalitas distribusi data dan tidak mempunyai outlier. Suatu
Scatterplot dapat mengungkap masalah-masalah yang mungkin ini.
Langkah untuk menghasilkan scatterplot dari variabel Sales menurut efisiensi bahan bakar
minyak maka perintahGraphs > Chart Builder dipakai.Langkah ini akan menyajikan kotak
dialog Chart Builder sebagai berikut :
Scatter/Dot gallery dipilih. Simple Scatter dipilih. Sales in thousands dipilih sebagai variabel
Y dan Fuel efficiency dipilih sebagai variabel X. Tombol OK ditekan. Langkah ini akan
menyajikan perintah sintaksis sebagai berikut :
* Chart Builder.
GGRAPH
/GRAPHDATASET NAME="graphdataset" VARIABLES=mpg sales model MISSING=
LISTWISE REPORTMISSING=NO
/GRAPHSPEC SOURCE=INLINE.
BEGIN GPL
SOURCE: s=userSource(id("graphdataset"))
DATA: mpg=col(source(s), name("mpg"))
DATA: sales=col(source(s), name("sales"))
DATA: model=col(source(s), name("model"), unit.category())
GUIDE: axis(dim(1), label("Fuel efficiency"))
GUIDE: axis(dim(2))
ELEMENT: point(position(mpg*sales), label(model))
END GPL.
Scatterplot yang dihasilkan mengungkap dua outlier yang potensial, yaitu Metro dan FSeries.
F-Series ditemukan sebagai perwakilan dari mobil yang dirancang oleh tim sehingga data ini
tetap terdapat dalam rangkaian data. Hal ini mungkin menampilkan outlier karena distribusi
dari Sales in thousands sehingga langkah mengganti ini dengan Log-transrformed Sales untuk
analisis lebih lanjut. Metro bukan perwakilan dari mobil yang dirancang sehingga hal ini
dapat dihapus dari analisis lebih lanjut.
Improving correlation Estimates
Langkah untuk menghapus Metro dari perhitungan korelasi dapat dilakukan melalui perintah
Data > Select Cases. Langtkah ini akan menyajikan kotak dialog Select Cases sebagai
berikut:
model ~= 'Metro' diketik. Tombol Continue ditekan. Tombol OK ditekan. Suatu variabel baru
telah dicipta yang memakai semua kasus kecuali Metro dalam perhitungan lebih lanjut.
Langkah untuk mengtanalisis data yang telah disaring, kotak dialog Bivariate Correlation
dipanggil lagi. Sales in thousand tidak dipilih. Log-transformed dipilih sebagai variabel
analisis. Pilihan ini mencipta perintah sintaksis sebagai berikut :
USE ALL.
COMPUTE filter_$=(model ~= 'Metro').
VARIABLE LABEL filter_$ "model ~= 'Metro' (FILTER)".
VALUE LABELS filter_$ 0 'Not Selected' 1 'Selected'.
FORMAT filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE .
CORRELATIONS
/VARIABLES=mpg lnsales
/PRINT=TWOTAIL NOSIG
/MISSING=PAIRWISE .
Correlations
Korelasi yang dihasilkan adalah sebagai berikut :
Correlations
Fuel efficiency
Fuel efficiency
Pearson Correlation
Log-transformed sales
Sig. (2-tailed)
Log-transformed sales
,136
,093
153
153
Pearson Correlation
,136
Sig. (2-tailed)
,093
153
156
Korelasi sekarang adalah positif akan tetapi tetap tidak berbeda dari 0 secara sifnifikan
setelah meniadakan oulier dan mengamati log-transformed sales. Demografi pelanggan untuk
truk dan mobil adalah berbeda, dan alasan-alasan untuk membeli truk atau mobil mungkin
juga tidak sama. Pengamatan atas scatterplot lain mungkin bermanfaat. Hal ini menandakan
bahwa truk dan mobil secara terpisah.
Suatu scatterplot of Log-transformed sales menurut Fuel efficiency, mengontrol Vehicle type,
tekan Chart Builder.Grouped Scatter dipilih. Log-transformed sales dipilih sebagai variabel Y,
dan Vehicle type dipilih sebagai variabelo untuk menetapkan warna.
Tombol OK ditekan. Langkah ini akan mencipta perintah sintaksis sebagai berikut :
GGRAPH
/GRAPHDATASET NAME="graphdataset" VARIABLES=mpg lnsales type MISSING=
LISTWISE REPORTMISSING=NO
/GRAPHSPEC SOURCE=INLINE.
BEGIN GPL
SOURCE: s=userSource(id("graphdataset"))
DATA: mpg=col(source(s), name("mpg"))
DATA: lnsales=col(source(s), name("lnsales"))
DATA: type=col(source(s), name("type"), unit.category())
GUIDE: axis(dim(1), label("Fuel efficiency"))
GUIDE: axis(dim(2))
GUIDE: legend(aesthetic(aesthetic.color.exterior), label("Vehicle type"))
SCALE: cat(aesthetic(aesthetic.color.exterior), include("0", "1"))
ELEMENT: point(position(mpg*lnsales), color.exterior(type))
END GPL.
10
Langkah untuk memisahkan arsip data menurut variabel Vechicle type dillakukan dengan
cara memakai perintah Data > Split File. Langkah ini akan menyajikan kotak dialog Split
File sebagai berikut :
Compare groups dipilih. Vehicle type dipilih sebagai variabel dasar dari pengelompokan.
Tombol OK ditekan.
11
Langkah untuk menganalisis arsip terpisah, kotak dialog Bivariate Correlation dipanggil
kembali dan tombol OK ditekan. Langkah ini akan mencipta perintah sintaksis sebagai
berikut :
SORT CASES BY type.
SPLIT FILE LAYERED BY type.
CORRELATIONS
/VARIABLES=sales mpg
/PRINT=TWOTAIL NOSIG
/MISSING=PAIRWISE.
Correlations
Vehicle type
Automobile
Fuel efficiency
Fuel efficiency
Pearson Correlation
Log-transformed sales
Sig. (2-tailed)
N
Log-transformed sales
Pearson Correlation
Sig. (2-tailed)
N
Truck
Fuel efficiency
Pearson Correlation
,000
114
114
**
,388
,000
114
116
,203
Sig. (2-tailed)
N
Log-transformed sales
,388**
,210
40
40
Pearson Correlation
,203
Sig. (2-tailed)
,210
40
41
Pemisahan arsip atas Vechicle type telah mengakibatkan hubungan antara sales dan fuel
efficiency adalah sangat lebih jelas. Signifikansi terdapat dan korelasi adalah kuat dan positif
akan tetapi tidak secara signifikan berbeda dari 0. Hal ini mencerminkan bahwa beberapa
pekerjaan diperlukan dan menunjukkan bahwa analisis korelasi memakai koefisien korelasi
Pearson tidak selalu langsung. Pemakaian nonparametric, untuk perbandingan, dilakukan
untuk menghindarkan kesulitan dari transformasi variabel-variabel. Nonparametric dilakukan
dengan cara memakai perintah Analyze>Correlate>Bivariate sehingga kotak dialog Bivariate
Correlations disajikan sebagai berikut :
Nonparametric Correlation Estimates
12
Spearman's rho ean Kendall's tau-b statistics eipakai untuk mengukur urutan peringkat
asosiasi antara dua variabel kuantitatif atau variabel kualitatif berjenis ordinal. Statistik
nonparametrik dapat dipakai tanpa mempertimbangkan
Langkah untuk memperoleh analisis memakai Sprearmans rho, kotak dialog Bivariate
Correlations dipanggil lagi. Pearson tidak dipilih dan Spearman dipilih. Tombol OK ditekan.
Langkah ini akan mencipta perintah-perintah sintaksis sebagai berikut :
NONPAR CORR
/VARIABLES=mpg lnsales sales
/PRINT=SPEARMAN TWOTAIL NOSIG
/MISSING=PAIRWISE.
13
Spearman's rho dilaporkan secara terpisah untuk mobil dan truk.Koefisien korelasi dari
asosiasi antara Lof=g-transformed sales danFuel efficiency adalah kuat. s fairly strong.
Spearman's rho mengandung laporan korelasi adalah sama untuk penjualan yang tidak
ditrasformasi.Hal ini karena rho berdasar atas urutan peringkat yang tidakdiubah oleh logtransformation Outliers adalah kurang memberikan dampak pada Spearman rho sehingga
memungkinkan untuk menyiman dan usaha dengan cara memakainya sebagai suatu ukuran
dari asosiasi.
Ringkasan
Pemakaian Bivariate Correlations dapat menghasilkan suatu matriks korelasi untuk Sales in
thousand dengan fuel efficiency dan hubungan negatif ditemukan. Usaha menhilangkan
outlier dan pemakaian Log-transformed sales, korelasi menjadi positif, walau tidak signifikan
berbeda
dari
0.
Perhitungan
korelasi
secara
terpisah
untuk
truk
dan
mobil
menghasilkankorelasi adalah positif dan korelasi secara statistik adalah signifikan antara sales
dan fuel efficency untuk mobil. Hasil-hasil serupa ditemukan juga tanpa transformasi jika
Spearmans rho dipakai. Ukuran-ukuran dari urutan peringkat adalah mudah untuk
menemukan apakah asosiasi terdapat atau tidak terdapat antara dua variabel, akan tetapi jika
asosiasi ditemukan maka gagasan yang baik untuk menemukan transformasi yang
mengakibatkan hubungan itu merupakan hubungan berbentuk garis lurus. Hal ini dialami
karena model-model prediktif tersedia untuk hubungan garis lurus dan model-model linear
adalah lebih mudah untuk mengimplementasikan dan menafsirkan.
Prosedur Bivariate Correlations bermanfat untuk melakukan studi dan penghayatan asosiasiasosiasi berpasangan untuk serangkaian variabel kuantitatif atau variabel klualitatif berjenis
ordinal. Prosedur Crosstabs dipakai jika variabel-variabel itu berjenis nominal untuk
memperoleh ukuran-ukuran dari asosiasi. Model dari variabel dengan nilai kuantitatif
berdasar atas hubungan garis lurus pada vaariabel-variabel lain, dan prosedur Linear
Rgression dapat dilakukan. Dekomposisi variabel-variabel berdasar atas hubungan garis lurus
untuk procedure is useful for studying the pairwise associations for a set of scale or ordinal
variables. Langkah melakukan dekomposisi atas variasi data maka pola-pola yang melandasi
perlu diamati melalui prosedur factor analysis.
Partial Correlations
14
Prosedur
mendeskripsikan hubungan linear antara dua variabel sedangkan suatu variabel dipakai untuk
melakukan pengawasan akibat-akibat dari satu variabel tambahan atau lebih. Semua variabel
harus variabel berjenis kuantitatif.
Pemakaian Partial Correlations
Data dalam laporan pemerintah menghasilkan korelasi positif dan tinggi antara dana
pemeliharaan kesehatan dan tingkat penyakit yang mengindikasikan bahwa orang-orang akan
lebih sehat jika pemerintah menghentikan pemberian dana ke dalam program-program
pemeliharaan kesehatan. Apakah jawaban atas keadaan ini adalah benar atau salah? Hal ini
jika diamati akan mengandung suatu hubungan sebab-akibat antara dana pemeliharaan
kesehatan dan tingkat penyakit. Asumsi yang dipakai di sini adalah jumlah-jumlah itu adalah
benar, apakah terdapat faktor-faktor lain yang mungkin saja mencipta penampilan dari suatu
hubungan itu tidak terdapat? Contoh ini memakai arsip data health_funding.sav.
Pelaksanaan Analisis
Perintah Analyze > Correlate > Partial dipakai untuk memperoleh partial correlations.
Langkah ini akan menyajikan kotak dialog Partial Correlations sebagai berikut :
15
Variabel Health care funding dan Reported disease rate dipilih sebagai variabel-variabel.
Tombol Options ditekan sehingga kotak dialog
sebagai berikut :
16
Variabel Visits to health care dipilih dan dimasukkan ke dalam kotak controlling for. Tombol
OK ditekan sehingga perintah sintaksis disajikan sebagai berikut :
PARTIAL CORR
/VARIABLES=funding disease BY visits
/SIGNIFICANCE=TWOTAIL
/STATISTICS=CORR
/MISSING=LISTWISE.
Control Variables
-none-a
Visits to health
care providers
(rate per 10,000)
Health care
funding
(amount per
100)
1,000
Reported
diseases
(rate per
10,000)
,737
Visits to
health care
providers
(rate per
10,000)
,964
,000
,000
Health care
funding
(amount per
100)
Correlation
Reported
diseases (rate
per 10,000)
Correlation
Significance (2-tailed)
df
0
,737
,000
48
48
1,000
0
48
,762
,000
48
Visits to health
care providers
(rate per
10,000)
Correlation
,964
,762
1,000
Significance (2-tailed)
,000
,000
Health care
funding
(amount per
100)
Reported
diseases (rate
per 10,000)
Correlation
Significance (2-tailed)
df
df
48
48
1,000
,013
Significance (2-tailed)
df
Correlation
Significance (2-tailed)
df
,928
0
47
,013
1,000
,928
47
17
Tabel Korelasi Parsial mengandung informasi mengenai korelasi nol-order (korelasi tanpa
variabel kontrol) dari ketiga variabel dan korelasi parsial dari dua variabel pertama
mengendalikan efek dari variabel ketiga. Korelasi zero-order antara dana perawatan
kesehatan dan tingkat penyakit, memang, keduanya cukup tinggi (0,737) dan secara statistik
adalah signifikan (p <0,001). Korelasi parsial mengendalikan tingkat kunjungan ke penyedia
layanan kesehatan, adalah (0,013) dan secara statistik adalah tidak signifikan (p = 0,928.).
Salah satu interpretasi dari penemuan ini adalah bahwa "hubungan" yang positif yang diamati
antara pendanaan pelayanan kesehatandan tingkat penyakit mendasari hubungan antara
masing-masing variabel dan tingkat kunjungan ke penyedia pelayanan kesehatan: ttingkat
penyakit hanya muncul untuk meningkatkan pendanaan kesehatan karena lebih banyak orang
memiliki akses ke penyedia pelayanan kesehatan ketika pendanaan mengalami peningkatan,
dokter dan rumah sakit akibatnya melaporkan lebih kejadian penyakit karena orang sakit
lebih banyak datang. Korelasi zero-order, mengungkap bahwa kedua variabel dana perawatan
kesehatan dan laporan tingkat penyakit sangat berkorelasi positif dengan variabel kontrol,
tingkat kunjungan ke penyedia pelayanan kesehatan. Peniadaan efek variabel ini mengurangi
korelasi antara dua variabel lain untuk hampir nol. Hal tersebut mungkin mengungkap bahwa
mengendalikan efek dari beberapa variabel lain yang relevan mungkin benar-benar
mengungkapkan hubungan negatif yang mendasari antara pendanaan kesehatan dan tingkat
penyakit.
Prosedur Korelasi Parsial hanya sesuai untuk variabel berjenis kuantitatif. Data kategori
(nominal atau ordinal) jika dimiliki, maka prosedur Tabulasi Frekuensi dipakai. Variabel
lapisan dalam Tabulasi Frekuensi mirip dengan mengontrol variabel dalam Korelasi Parsial.
Jika Anda ingin Model nilai variabel berjenis kuantitatif jika diinginkan dapat dilakukan
berdasar atas hubungan linier dengan variabel lain, dan prosedur Linear Regression dapat
juga dicoba.
Rangkuman
Pembahasan mengenai Correlasi di sini hanya mencakup pembahasan mengenai Bivariate
Correlation dan Partial Correlation. Analisis korelasi menekankan pada kekuatan dan arah
dari hubungan antara dua variabel atau lebih dan hasil analisis korelasi disajikan dalam tabel
berbentuk matriks. Analisis korelasi dapat berdasar atas statistik parametrik dan dapat juga
18
19
20