Você está na página 1de 20

IBM SPSS STATISTICS VERSION 22

Oleh :
Abdullah M. Jaubah

Pendahuluan
Latihan ini merupakan latihan kesepuluh

mengenai prosedur correlate. Prosedur yang

terkandung dalam Correlate adalah prosedur Bivariate Correlation, Partial Correlation, dan
Distance. Prosedur korelasi bivariat dipakai untuk menghitung koefisien korelasi Pearson,
Sprearmans rho, dan Kendalls tau-b dengan tingkat-tingkat signifikan tertentu. Korelasi
dipakai untuk mengukur hubungan antara variabel-variabel atau hubungan menurut urutan
peringkat. Data harus dibersihkan dari outliers karena dapat menberikan hasil-hasil yang
mengandung kesalahan dan bukti dari suatu hubungan garis lurus. Koefisien korelasi Pearson
merupakan suatu ukuran asosiasi garis lurus. Dua variabel dapat berhubungan secara
sempurna, akan tetapi jika hubungan adalah tidak linear, maka koefisien korelasi Pearson
bukan merupakan statistik yang serasi untuk mengukur asosiasi. Prosedur korelasi parsial
ldipakai untuk menghitung koefisien-koefisien korelasi parsial yang mendeskripsikan
hubungan garis lurus antara dua variabel dan variabel kontrol dipakai untuk mengawasi
akibat-akibat dari satu atau lebih variabel tambahan.

Dua variabel dapat mempunyai

hubungan sempurna akan tetapi jika hubungan itu tidak berbentuk garis lurus, maka koefisien
korelasi adalah tidak sesuai secara statistik untuk mengukur asosiasi. Prosedur ini dipakai
untuk menghitung berbagai ragam ukuran baik kesamaan atau ketidaksamaan (jarak) antara
pasangan variabel atan antara pasangan kasus. Ukuran kesamaan atau jarak ini dipakai
dengan prosedur lain seperti prosedur analisis faktor, analisis klaster, atau multidimensional
scaling, untuk membantu analisis atas data yang kompleks. Ketidaksamaan (jarak) dipakau
untuk mengukur data interval adalah Euclidean distance, squared Euclidean distance,
Chebychev, block, Minkowski, atau customized; untuk data kuantitatif, chi-square atau phisquare; untuk data biner, Euclidean distance, squared Euclidean distance, size difference,
pattern difference, variance, shape, atau Lance and Williams. Ukuran-ukuran kesamaan untuk
data interval adalah

Pearson correlation atau cosine; untuk data binary, Russel dan Rao,

simple matching, Jaccard, dice, Rogers dan Tanimoto, Sokal dan Sneath 1, Sokal dan Sneath
2, Sokal dan Sneath 3, Kulczynski 1, Kulczynski 2, Sokal dan Sneath 4, Hamann, Lambda,
1

Anderberg's D, Yule's Y, Yule's Q, Ochiai, Sokal dand Sneath 5, phi 4-point correlation, atau
dispersi.
Prosedur Bivariate Correlations dipakai untuk menghitung asosiasi berpasangan untuk
serangkaian variabel dan menyajikan hasil-hasil dalam suatu matriks. Prosedur Bivariate
Correlation bermanfaat untuk menentukan kekuatan dan arah dari asosiasi antara dua
variabel berjenis kuantitatif atau dua variabel berjenis ordinal.
Pemakaian Korelasi Untuk Melakukan Studi Asosiasi
Para engineer merancang mobil, agar penjualan meningkat, ingin memusatkan perhatian
mereka atas aspek-aspek dari mobil yang penting bagi para pelanggan, misalkan, peranan
penting dari efisiensi bahan bakar minyak dalam huhungannya dengan penjualan. Salah satu
cara untuk mengukur hal ini adalah menghitung korelasi antara penjualan masa lalu dan
efisiensi bahan bakar minyak.
Informasi mengenai

berbagai pembuatan mobil dikumpulkan dalam arsip car_sales,sav.

Korelasi bivariat dipakai untuk mengukur tingkat kepentingan dari efisiensi bahan bakar
minyak dan penjualan mobil.

Perintah Analyze > Correlate > Bivariate dipakai. Langkah ini akan menyajikan kotak dialog
Bivariate Correlations sebagai berikut :
2

Variabel Sales in thousands dan variabel Fuel efficiency dipilih sebagai variabel-variabel
analisis. Tombol OK ditekan. Langkah ini akan mencipta perintah sintaksis sebagai berikut :
GET
FILE='D:\SPSS22\car_sales.sav'.
CORRELATIONS
/VARIABLES=sales mpg
/PRINT=TWOTAIL NOSIG
/MISSING=PAIRWISE.

Prosedur ini menghasilkan matriks korelasi untuk penjualan dan mpg. Semua nilai dari
peluang lain ditetapkan sesuai dengan ketentuan.
Correlation Matrix
Correlations
Sales in thousands
Sales in thousands

Pearson Correlation

Sig. (2-tailed)
N
Fuel efficiency

Pearson Correlation

Fuel efficiency
-,017
,837

157

154

-,017

Sig. (2-tailed)

,837

154

154

Koefisien korelasi Pearson dipakai untuk mengukur asosiasi linear antarqa dua variabel
berjenis kuantitatif. Korelasi tercermin dalam tabel adalah negatif walau tidak secara
sifnifikan berbeda dari
0 karena nilai-p adalah 0.837 adalah lebih besar daripada nilai 0.10. Hal ini mengungkap
bahwa para perancang tidak harus memusatkan usaha-usaha mereka atas pembuatan mobil
yang lebih efisien dalam pemakaian bahan bakar minyak karena tidak mempunyai akibat
yang cukup besar pada penjualan. Koefisien korelasi Pearson bekerja terbaik jika variabelvariabel memenuhi persyaratan normalitas distribusi data dan tidak mempunyai outlier. Suatu
Scatterplot dapat mengungkap masalah-masalah yang mungkin ini.

Langkah untuk menghasilkan scatterplot dari variabel Sales menurut efisiensi bahan bakar
minyak maka perintahGraphs > Chart Builder dipakai.Langkah ini akan menyajikan kotak
dialog Chart Builder sebagai berikut :

Scatter/Dot gallery dipilih. Simple Scatter dipilih. Sales in thousands dipilih sebagai variabel
Y dan Fuel efficiency dipilih sebagai variabel X. Tombol OK ditekan. Langkah ini akan
menyajikan perintah sintaksis sebagai berikut :
* Chart Builder.
GGRAPH
/GRAPHDATASET NAME="graphdataset" VARIABLES=mpg sales model MISSING=
LISTWISE REPORTMISSING=NO
/GRAPHSPEC SOURCE=INLINE.
BEGIN GPL
SOURCE: s=userSource(id("graphdataset"))
DATA: mpg=col(source(s), name("mpg"))
DATA: sales=col(source(s), name("sales"))
DATA: model=col(source(s), name("model"), unit.category())
GUIDE: axis(dim(1), label("Fuel efficiency"))
GUIDE: axis(dim(2))
ELEMENT: point(position(mpg*sales), label(model))
END GPL.

Grafik disajikan sebagai berikut :

Scatterplot yang dihasilkan mengungkap dua outlier yang potensial, yaitu Metro dan FSeries.
F-Series ditemukan sebagai perwakilan dari mobil yang dirancang oleh tim sehingga data ini
tetap terdapat dalam rangkaian data. Hal ini mungkin menampilkan outlier karena distribusi
dari Sales in thousands sehingga langkah mengganti ini dengan Log-transrformed Sales untuk
analisis lebih lanjut. Metro bukan perwakilan dari mobil yang dirancang sehingga hal ini
dapat dihapus dari analisis lebih lanjut.
Improving correlation Estimates

Langkah untuk menghapus Metro dari perhitungan korelasi dapat dilakukan melalui perintah
Data > Select Cases. Langtkah ini akan menyajikan kotak dialog Select Cases sebagai
berikut:

Kondisi if dipilih dan tombol if ditekan.

model ~= 'Metro' diketik. Tombol Continue ditekan. Tombol OK ditekan. Suatu variabel baru
telah dicipta yang memakai semua kasus kecuali Metro dalam perhitungan lebih lanjut.

Langkah untuk mengtanalisis data yang telah disaring, kotak dialog Bivariate Correlation
dipanggil lagi. Sales in thousand tidak dipilih. Log-transformed dipilih sebagai variabel
analisis. Pilihan ini mencipta perintah sintaksis sebagai berikut :
USE ALL.
COMPUTE filter_$=(model ~= 'Metro').
VARIABLE LABEL filter_$ "model ~= 'Metro' (FILTER)".
VALUE LABELS filter_$ 0 'Not Selected' 1 'Selected'.
FORMAT filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE .
CORRELATIONS
/VARIABLES=mpg lnsales
/PRINT=TWOTAIL NOSIG
/MISSING=PAIRWISE .

Correlations
Korelasi yang dihasilkan adalah sebagai berikut :
Correlations
Fuel efficiency
Fuel efficiency

Pearson Correlation

Log-transformed sales

Sig. (2-tailed)

Log-transformed sales

,136
,093

153

153

Pearson Correlation

,136

Sig. (2-tailed)

,093

153

156

Korelasi sekarang adalah positif akan tetapi tetap tidak berbeda dari 0 secara sifnifikan
setelah meniadakan oulier dan mengamati log-transformed sales. Demografi pelanggan untuk
truk dan mobil adalah berbeda, dan alasan-alasan untuk membeli truk atau mobil mungkin
juga tidak sama. Pengamatan atas scatterplot lain mungkin bermanfaat. Hal ini menandakan
bahwa truk dan mobil secara terpisah.
Suatu scatterplot of Log-transformed sales menurut Fuel efficiency, mengontrol Vehicle type,
tekan Chart Builder.Grouped Scatter dipilih. Log-transformed sales dipilih sebagai variabel Y,
dan Vehicle type dipilih sebagai variabelo untuk menetapkan warna.

Tombol OK ditekan. Langkah ini akan mencipta perintah sintaksis sebagai berikut :
GGRAPH
/GRAPHDATASET NAME="graphdataset" VARIABLES=mpg lnsales type MISSING=
LISTWISE REPORTMISSING=NO
/GRAPHSPEC SOURCE=INLINE.
BEGIN GPL
SOURCE: s=userSource(id("graphdataset"))
DATA: mpg=col(source(s), name("mpg"))
DATA: lnsales=col(source(s), name("lnsales"))
DATA: type=col(source(s), name("type"), unit.category())
GUIDE: axis(dim(1), label("Fuel efficiency"))
GUIDE: axis(dim(2))
GUIDE: legend(aesthetic(aesthetic.color.exterior), label("Vehicle type"))
SCALE: cat(aesthetic(aesthetic.color.exterior), include("0", "1"))
ELEMENT: point(position(mpg*lnsales), color.exterior(type))
END GPL.

Scatterplot yang dihasilkan adalah sebagai berikut :

Scatterplot mengungkap bahwa truk dan mobil membentuk kelompok-kelompok berbeda.


Pemisahan arsip data menurut Vechicle type, mungkin pandangan yang lebih akurat akan
diperoleh dari asosiasi itu. Log-transformation of sales juga mengandung outlier potensial
dalam bagian atas sebelah kiri telah tidak disajikan.
Perbaikan Correlation Estimates: Pemisahan Arsip Data

10

Langkah untuk memisahkan arsip data menurut variabel Vechicle type dillakukan dengan
cara memakai perintah Data > Split File. Langkah ini akan menyajikan kotak dialog Split
File sebagai berikut :

Compare groups dipilih. Vehicle type dipilih sebagai variabel dasar dari pengelompokan.
Tombol OK ditekan.

11

Langkah untuk menganalisis arsip terpisah, kotak dialog Bivariate Correlation dipanggil
kembali dan tombol OK ditekan. Langkah ini akan mencipta perintah sintaksis sebagai
berikut :
SORT CASES BY type.
SPLIT FILE LAYERED BY type.
CORRELATIONS
/VARIABLES=sales mpg
/PRINT=TWOTAIL NOSIG
/MISSING=PAIRWISE.
Correlations
Vehicle type
Automobile

Fuel efficiency
Fuel efficiency

Pearson Correlation

Log-transformed sales

Sig. (2-tailed)
N
Log-transformed sales

Pearson Correlation
Sig. (2-tailed)
N

Truck

Fuel efficiency

Pearson Correlation

,000
114

114

**

,388

,000
114

116

,203

Sig. (2-tailed)
N
Log-transformed sales

,388**

,210
40

40

Pearson Correlation

,203

Sig. (2-tailed)

,210

40

41

**. Correlation is significant at the 0.01 level (2-tailed).

Pemisahan arsip atas Vechicle type telah mengakibatkan hubungan antara sales dan fuel
efficiency adalah sangat lebih jelas. Signifikansi terdapat dan korelasi adalah kuat dan positif
akan tetapi tidak secara signifikan berbeda dari 0. Hal ini mencerminkan bahwa beberapa
pekerjaan diperlukan dan menunjukkan bahwa analisis korelasi memakai koefisien korelasi
Pearson tidak selalu langsung. Pemakaian nonparametric, untuk perbandingan, dilakukan
untuk menghindarkan kesulitan dari transformasi variabel-variabel. Nonparametric dilakukan
dengan cara memakai perintah Analyze>Correlate>Bivariate sehingga kotak dialog Bivariate
Correlations disajikan sebagai berikut :
Nonparametric Correlation Estimates

12

Spearman's rho ean Kendall's tau-b statistics eipakai untuk mengukur urutan peringkat
asosiasi antara dua variabel kuantitatif atau variabel kualitatif berjenis ordinal. Statistik
nonparametrik dapat dipakai tanpa mempertimbangkan

distribusi dari variabel-variabel.

Langkah untuk memperoleh analisis memakai Sprearmans rho, kotak dialog Bivariate
Correlations dipanggil lagi. Pearson tidak dipilih dan Spearman dipilih. Tombol OK ditekan.
Langkah ini akan mencipta perintah-perintah sintaksis sebagai berikut :
NONPAR CORR
/VARIABLES=mpg lnsales sales
/PRINT=SPEARMAN TWOTAIL NOSIG
/MISSING=PAIRWISE.

13

Spearman's rho dilaporkan secara terpisah untuk mobil dan truk.Koefisien korelasi dari
asosiasi antara Lof=g-transformed sales danFuel efficiency adalah kuat. s fairly strong.
Spearman's rho mengandung laporan korelasi adalah sama untuk penjualan yang tidak
ditrasformasi.Hal ini karena rho berdasar atas urutan peringkat yang tidakdiubah oleh logtransformation Outliers adalah kurang memberikan dampak pada Spearman rho sehingga
memungkinkan untuk menyiman dan usaha dengan cara memakainya sebagai suatu ukuran
dari asosiasi.
Ringkasan
Pemakaian Bivariate Correlations dapat menghasilkan suatu matriks korelasi untuk Sales in
thousand dengan fuel efficiency dan hubungan negatif ditemukan. Usaha menhilangkan
outlier dan pemakaian Log-transformed sales, korelasi menjadi positif, walau tidak signifikan
berbeda

dari

0.

Perhitungan

korelasi

secara

terpisah

untuk

truk

dan

mobil

menghasilkankorelasi adalah positif dan korelasi secara statistik adalah signifikan antara sales
dan fuel efficency untuk mobil. Hasil-hasil serupa ditemukan juga tanpa transformasi jika
Spearmans rho dipakai. Ukuran-ukuran dari urutan peringkat adalah mudah untuk
menemukan apakah asosiasi terdapat atau tidak terdapat antara dua variabel, akan tetapi jika
asosiasi ditemukan maka gagasan yang baik untuk menemukan transformasi yang
mengakibatkan hubungan itu merupakan hubungan berbentuk garis lurus. Hal ini dialami
karena model-model prediktif tersedia untuk hubungan garis lurus dan model-model linear
adalah lebih mudah untuk mengimplementasikan dan menafsirkan.
Prosedur Bivariate Correlations bermanfat untuk melakukan studi dan penghayatan asosiasiasosiasi berpasangan untuk serangkaian variabel kuantitatif atau variabel klualitatif berjenis
ordinal. Prosedur Crosstabs dipakai jika variabel-variabel itu berjenis nominal untuk
memperoleh ukuran-ukuran dari asosiasi. Model dari variabel dengan nilai kuantitatif
berdasar atas hubungan garis lurus pada vaariabel-variabel lain, dan prosedur Linear
Rgression dapat dilakukan. Dekomposisi variabel-variabel berdasar atas hubungan garis lurus
untuk procedure is useful for studying the pairwise associations for a set of scale or ordinal
variables. Langkah melakukan dekomposisi atas variasi data maka pola-pola yang melandasi
perlu diamati melalui prosedur factor analysis.
Partial Correlations
14

Prosedur

Partial Correlations dipakai untuk menghitung koefisien korelasi parsial yang

mendeskripsikan hubungan linear antara dua variabel sedangkan suatu variabel dipakai untuk
melakukan pengawasan akibat-akibat dari satu variabel tambahan atau lebih. Semua variabel
harus variabel berjenis kuantitatif.
Pemakaian Partial Correlations
Data dalam laporan pemerintah menghasilkan korelasi positif dan tinggi antara dana
pemeliharaan kesehatan dan tingkat penyakit yang mengindikasikan bahwa orang-orang akan
lebih sehat jika pemerintah menghentikan pemberian dana ke dalam program-program
pemeliharaan kesehatan. Apakah jawaban atas keadaan ini adalah benar atau salah? Hal ini
jika diamati akan mengandung suatu hubungan sebab-akibat antara dana pemeliharaan
kesehatan dan tingkat penyakit. Asumsi yang dipakai di sini adalah jumlah-jumlah itu adalah
benar, apakah terdapat faktor-faktor lain yang mungkin saja mencipta penampilan dari suatu
hubungan itu tidak terdapat? Contoh ini memakai arsip data health_funding.sav.
Pelaksanaan Analisis

Perintah Analyze > Correlate > Partial dipakai untuk memperoleh partial correlations.
Langkah ini akan menyajikan kotak dialog Partial Correlations sebagai berikut :

15

Variabel Health care funding dan Reported disease rate dipilih sebagai variabel-variabel.
Tombol Options ditekan sehingga kotak dialog

Partial Correlations : Options disajikan

sebagai berikut :

Zero-order correlations dipilih dan tombol Continue ditekan.

16

Variabel Visits to health care dipilih dan dimasukkan ke dalam kotak controlling for. Tombol
OK ditekan sehingga perintah sintaksis disajikan sebagai berikut :
PARTIAL CORR
/VARIABLES=funding disease BY visits
/SIGNIFICANCE=TWOTAIL
/STATISTICS=CORR
/MISSING=LISTWISE.

Tabel Partial Correlations


Tabel Partial Correlations juga dihasilkan sebagai berikut :
Correlations

Control Variables
-none-a

Visits to health
care providers
(rate per 10,000)

Health care
funding
(amount per
100)
1,000

Reported
diseases
(rate per
10,000)
,737

Visits to
health care
providers
(rate per
10,000)
,964

,000

,000

Health care
funding
(amount per
100)

Correlation

Reported
diseases (rate
per 10,000)

Correlation
Significance (2-tailed)
df

0
,737
,000
48

48
1,000
0

48
,762
,000
48

Visits to health
care providers
(rate per
10,000)

Correlation

,964

,762

1,000

Significance (2-tailed)

,000

,000

Health care
funding
(amount per
100)
Reported
diseases (rate
per 10,000)

Correlation

Significance (2-tailed)
df

df

48

48

1,000

,013

Significance (2-tailed)
df
Correlation
Significance (2-tailed)
df

,928
0

47

,013

1,000

,928
47

a. Cells contain zero-order (Pearson) correlations.

17

Tabel Korelasi Parsial mengandung informasi mengenai korelasi nol-order (korelasi tanpa
variabel kontrol) dari ketiga variabel dan korelasi parsial dari dua variabel pertama
mengendalikan efek dari variabel ketiga. Korelasi zero-order antara dana perawatan
kesehatan dan tingkat penyakit, memang, keduanya cukup tinggi (0,737) dan secara statistik
adalah signifikan (p <0,001). Korelasi parsial mengendalikan tingkat kunjungan ke penyedia
layanan kesehatan, adalah (0,013) dan secara statistik adalah tidak signifikan (p = 0,928.).
Salah satu interpretasi dari penemuan ini adalah bahwa "hubungan" yang positif yang diamati
antara pendanaan pelayanan kesehatandan tingkat penyakit mendasari hubungan antara
masing-masing variabel dan tingkat kunjungan ke penyedia pelayanan kesehatan: ttingkat
penyakit hanya muncul untuk meningkatkan pendanaan kesehatan karena lebih banyak orang
memiliki akses ke penyedia pelayanan kesehatan ketika pendanaan mengalami peningkatan,
dokter dan rumah sakit akibatnya melaporkan lebih kejadian penyakit karena orang sakit
lebih banyak datang. Korelasi zero-order, mengungkap bahwa kedua variabel dana perawatan
kesehatan dan laporan tingkat penyakit sangat berkorelasi positif dengan variabel kontrol,
tingkat kunjungan ke penyedia pelayanan kesehatan. Peniadaan efek variabel ini mengurangi
korelasi antara dua variabel lain untuk hampir nol. Hal tersebut mungkin mengungkap bahwa
mengendalikan efek dari beberapa variabel lain yang relevan mungkin benar-benar
mengungkapkan hubungan negatif yang mendasari antara pendanaan kesehatan dan tingkat
penyakit.
Prosedur Korelasi Parsial hanya sesuai untuk variabel berjenis kuantitatif. Data kategori
(nominal atau ordinal) jika dimiliki, maka prosedur Tabulasi Frekuensi dipakai. Variabel
lapisan dalam Tabulasi Frekuensi mirip dengan mengontrol variabel dalam Korelasi Parsial.
Jika Anda ingin Model nilai variabel berjenis kuantitatif jika diinginkan dapat dilakukan
berdasar atas hubungan linier dengan variabel lain, dan prosedur Linear Regression dapat
juga dicoba.
Rangkuman
Pembahasan mengenai Correlasi di sini hanya mencakup pembahasan mengenai Bivariate
Correlation dan Partial Correlation. Analisis korelasi menekankan pada kekuatan dan arah
dari hubungan antara dua variabel atau lebih dan hasil analisis korelasi disajikan dalam tabel
berbentuk matriks. Analisis korelasi dapat berdasar atas statistik parametrik dan dapat juga

18

berdasar atas statistik nonparametrik. Statistik parametrik memakai koefisien korelasi


Pearson dan statistik nonparametrik memakai koefisien korelasi Spearman rho.
Daftar Kepustakaan

IBM SPSS Statistics, Inc. 2013.Case Studies


Permata Depok Regency, 26 April 2016

19

20

Você também pode gostar