Você está na página 1de 12

KORELASI PEARSON

Korelasi Pearson merupakan salah satu ukuran korelasi yang digunakan untuk mengukur
kekuatan dan arah hubungan linier dari dua veriabel. Dua variabel dikatakan berkorelasi apabila
perubahan salah satu variabel disertai dengan perubahan variabel lainnya, baik dalam arah yang
sama ataupun arah yang sebaliknya. Harus diingat bahwa nilai koefisien korelasi yang kecil
(tidak signifikan) bukan berarti kedua variabel tersebut tidak saling berhubungan. Mungkin
saja dua variabel mempunyai keeratan hubungan yang kuat namun nilai koefisien korelasinya
mendekati nol, misalnya pada kasus hubungan non linier. Dengan demikian, koefisien korelasi
hanya mengukur kekuatan hubungan linier dan tidak pada hubungan non linier. Harus
diingat pula bahwa adanya hubungan linier yang kuat di antara variabel tidak selalu
berarti ada hubungan kausalitas, sebab-akibat.

Pendahuluan
Seringkali peneliti mengamati beberapa parameter dari sampling atau satuan pengamatan yang
sama. Sebagai contoh, pada penelitian pengujian suatu jenis pupuk tertentu, selain mencatat hasil
padi, mungkin juga Peneliti ingin mencatat beberapa respons lainnya, seperti jumlah bulir, berat
100 biji, jumlah anakan, serapan Nitrogen, serapan kalium dsb. Apabila hanya terdapat dua
variabel yang dicatat, dikatakan bivariate, sedangkan apabila lebih, dikatakan multivariate.
Variabel yang di catat tersebut nilainya bersifat acak, sehingga dikatakan sebagai variabel acak.
Berbeda dengan dosis pupuk yang sudah ditentukan sebelumnya, variabel pupuk tersebut bersifat
tetap, sehingga dikatakan variabel tetap. Mungkin saja, selain peneliti ingin melihat hubungan
antara dosis pupuk (faktor) dengan hasil padi (respons) , dia juga ingin melihat hubungan di
antara pasangan variabel-variabel respons yang dia amati. Apakah peningkatan serapan nitrogen
seiring dengan peningkatan hasil atau justru sebaliknya dan bagaimanakah pula kekuatan
hubungannya? Kekuatan dan arah hubungan linier di antara kedua variabel tersebut bisa
dijelaskan dengan ukuran statistik yang dinamakan dengan “koefisien korelasi”.

Eksplorasi data
Sebelum melakukan analisis korelasi antar variabel, sebaiknya kita mengeksplorasi data tersebut
terlebih dahulu secara grafis. Seringkali kita melihat pola hubungan di antara variabel dengan
cara memplotkan pasangan sampel data tersebut pada diagram kartesian yang disebut dengan
scatterplot atau diagram pencar. Setiap pasangan data (x, y) diplotkan sebagai titik tunggal.

Contoh diagram pencar dapat dilihat pada gambar berikut.


Secara sepintas kita bisa melihat pola hubungan dari grafik-grafik tersebut. Pada Grafik a, b, c
terlihat bahwa peningkatan nilai y sejalan dengan peningkatan nilai x. Apabila nilai x meningkat,
maka nilai y pun meningkat, dan sebaliknya. Dari Grafik a sampai c, sebaran titik-titik pasangan
data semakin mendekati bentuk garis lurus yang menunjukkan bahwa keeratan hubungan antara
variabel x dan y semakin kuat (sinergis).

Hal yang sebaliknya terjadi pada Grafik d, e, dan f. Peningkatan nilai y tidak sejalan dengan
peningkatan nilai x (antagonis). Peningkatan salah satu nilai menyebabkan penurunan nilai
pasangannya. Sekali lagi tampak bahwa kekuatan hubungan antara kedua variabel dari d menuju
f semakin kuat.

Berbeda dengan grafik sebelumnya, pada Grafik g tidak menunjukkan adanya pola hubungan
linier antara kedua variabel. Hal ini menandakan bahwa tidak ada korelasi di antara kedua
variabel tersebut. Terkahir, pada Grafik h kita bisa melihat adanya pola hubungan di antara
kedua variabel tersebut, hanya saja polanya bukan dalam bentuk hubungan linier, melainkan
dalam bentuk kuadratik.
Kovarian dan Korelasi
Untuk memahami korelasi linier antara dua variabel, terdapat dua elemen yang harus kita tinjau,
mengukur hubungan diantara dua variabel (kovarian) dan proses standarisasi.

Kovarian

Salah satu ukuran kekuatan hubungan linear antara dua variabel acak kontinu adalah dengan
menentukan seberapa banyak kedua variabel tersebut co-vary, yaitu bervariasi bersama-sama.
Jika salah satu variabel meningkat (atau menurun) sebagai akibat peningkatan (atau penurunan)
variabel pasangannya, maka dua variabel tersebut dinamakan covary. Namun jika satu variabel
tidak berubah dengan meningkatnya (atau penurunan) variabel lain, maka variabel tersebut tidak
covary. Statistik untuk mengukur berapa banyak kedua variabel covary dalam sampel
pengamatan adalah kovarian.

Selain mengukur besarnya kekuatan hubungan di antara


dua variabel, kovarian juga menentukan arah hubungan dari kedua variabel tersebut.

1. Apabila nilainya positif, berati bahwa apabila nilai x berada di atas nilai rata-ratanya,
maka nilai y juga berada di atas nilai rata-rata y, dan sebaliknya (Searah).
2. Nilai kovarian negatif menunjukkan bahwa apabila nilai x berada di atas nilai rata-
ratanya sedangkan nilai y berada di bawah nilai rata-ratanya (berlawanan arah).
3. Terakhir, apabila nilai kovarian mendekati nol, menandakan bahwa kedua variabel
tersebut tidak saling berhubungan.

Standarisasi

Salah satu keterbatasan kovarian sebagai ukuran kekuatan hubungan linier adalah arah/besarnya
gradien yang tergantung pada satuan dari kedua variabel tersebut. Misalnya, kovarian antara
serapan N (%) dan Hasil Padi (ton) akan jauh lebih besar apabila satuan % (1/100) kita konversi
ke ppm (1/sejuta). Agar nilai kovarian tidak tergantung kepada unit dari masing-masing variabel,
maka kita harus membakukannya terlebih dahulu yaitu dengan cara membagi nilai kovarians
tersebut dengan nilai standar deviasi dari kedua variabel tersebut sehingga nilainya akan terletak
antara -1 dan +1. Ukuran statistik tersebut dikenal dengan Pearson product moment correlation
yang mengukur kekuatan hubungan linier (garis lurus) dari kedua variabel tersebut. Koefisien
korelasi linear kadang-kadang disebut sebagai koefisien korelasi pearson untuk menghormati
Karl Pearson (1857-1936), yang pertama kali mengembangkan ukuran statistik ini.

Kovarian:

Standar Deviasi variabel X dan Y:


Korelasi:

Nilai kovarian distandarkan dengan membagi nilai kovarian tersebut dengan nilai standar deviasi
kedua variabel.

atau

atau

Koefisien Korelasi

Koefisien korelasi mengukur kekuatan dan arah hubungan linier dari dua veriabel. Harus diingat
bahwa nilai koefisien korelasi yang kecil (tidak signifikan) bukan berarti kedua variabel tersebut
tidak saling berhubungan. Mungkin saja dua variabel mempunyai keeratan hubungan yang kuat
namun nilai koefisien korelasinya mendekati nol, misalnya pada kasus hubungan non linier.
Dengan demikian, koefisien korelasi hanya mengukur kekuatan hubungan linier dan tidak
pada hubungan non linier.

Harus diingat pula bahwa adanya hubungan linier yang kuat di antara variabel tidak
selalu berarti ada hubungan kausalitas, sebab-akibat. Kedua pasang variabel, x dan y bisa
saja nilai koefisien korelasinya tinggi sebagai akibat adanya faktor z. Sebagai contoh, suhu (x)
dengan tekanan udara (y) mungkin saja nilai koefisien korelasinya tinggi, namun belum tentu
keduanya menunjukkan adanya hubungan sebab akibat (misal, semakin rendah suhu udara maka
tekanan udara akan semakin rendah). Adanya korelasi suhu dan tekanan udara tersebut bisa saja
semata-mata sebagai akibat dari perubahan ketinggian (z) suatu tempat, semakin tinggi tempat
maka baik suhu ataupun tekanan udara akan semakin menurun. (meskipun secara teoritis
memang terdapat hubungan sebanding antara suhu dan tekanan: PV = nRT). Dengan demikian,
Korelasi hanya menjelaskan kekuatan hubungan tanpa memperhatikan hubungan
kausalitas, mana yang dipengaruhi dan mana yang mempengaruhi. Kedua variabel
masing-masing bisa berperan sebagai Variabel X maupun Variabel Y.

Karakteristik korelasi

 Nilai r selalu terletak antara -1 dan +1


 Nilai r tidak berubah apabila seluruh data baik pada variabel x, variabel y, atau keduanya
dikalikan dengan suatu nilai konstanta (c) tertetu (asalkan c ≠ 0).
 Nilai r tidak berubah apabila seluruh data baik pada variabel x, variabel y, atau keduanya
ditambahkan dengan suatu nilai konstanta (c) tertetu.
 Nilai r tidak akan dipengaruhi oleh penentuan mana variabel x dan mana variabel y.
Kedua variabel bisa saling dipertukarkan.
 Nilai r hanya untuk mengukur kekuatan hubungan linier, dan tidak dirancang untuk
mengukur hubungan non linier

Asumsi
Asumsi untuk analisis korelasi:

1. Sampel data berpasangan (x, y) berasal dari sampel acak dan merupakan data kuantitatif.
2. Pasangan data (x, y) harus berdistribusi normal.

Harus diingat bahwa analisis korelasi sangat sensitif terhadap data pencilan (outliers)!

Asumsi bisa dicek secara visual dengan menggunakan:

 Boxplots, histograms & univariate scatterplots untuk masing-masing variabel


 Bivariate scatterplots

Apabila tidak memenuhi asumsi misalnya data tidak berdistribusi normal (atau ada nilai data
pencilan), kita bisa menggunakan korelasi Spearman (Spearman rank correlation), korelasi
untuk analisis non-parametrik.

Koefisien Determinasi
Koefisien korelasi, r, hanya menyediakan ukuran kekuatan dan arah hubungan linier antara dua
variabel. Akan tetapi tidak memberikan informasi mengenai berapa proporsi keragaman (variasi)
variabel dependen (Y) yang dapat diterangkan atau diakibatkan oleh hubungan linier dengan
nilai variabel independen (X). Nilai r tidak bisa dibandingkan secara langsung, misalnya kita
tidak bisa mengatakan bahwa nilai r = 0.8 merupakan dua kali lipat dari nilai r =0.4.

Untungnya, nilai kuadrat dari r bisa mengukur secara tepat rasio/proposi tersebut, dan nilai
statistik ini dinamakan dengan Koefisien Determinasi, r2. Dengan demikian, Koefisien
Determinasi bisa didefinisikan sebagai nilai yang menyatakan proporsi keragaman Y yang dapat
diterangkan/dijelaskan oleh hubungan linier antara variabel X dan Y.

Misalnya, apabila nilai korelasi (r) antara Serapan N dengan hasil = 0.8, maka r2 = 0.8 x 0.8 =
0.64=64%. Hal ini berarti bahwa 64% keragaman Hasil padi bisa diterangkan/dijelaskan oleh
tinggi rendahnya Serapan N. Sisanya, sebesar 36% mungkin disebabkan oleh faktor lain dan atau
error (galat) dari percobaan.

Pengujian Koefisien Korelasi


Terdapat dua metode yang biasa digunakan untuk menguji kebermaknaan koefisien korelasi.
Metode pertama dengan menggunakan Uji-t dan Metode kedua dengan menggunakan tabel r.

Bagan Alir untuk pengujian hipotesis:

Catatan:

Nilai tabel kritis r bisa di lihat pada tabel di bawah ini. Nilai kritis r selengkapnya bisa di lihat
pada link berikut critical-values-of-the-pearson-correlation-coeffiecient-r:

Faktor yang akan mempengaruhi nilai uji korelasi:


Ukuran koefisien korelasi dan ukuran/banyaknya sampel.

Contoh Terapan
Berikut adalah data usia, berat, dan tekanan darah.

Individual Age Weight Systolic Pressure


A 34 45 108
B 43 44 129
C 49 56 126
D 58 57 149
E 64 65 168
F 73 63 161
G 78 55 174

Untuk kasus ini, kita ingin melihat apakah terdapat hubungan linier antara usia dengan tekanan
darah sistolik? Taraf nyata yang digunakan adalah 5%.

Hipotesis:

H0: ρ = 0 vs H1: ρ ≠ 0

Eksplorasi Data

Berdasarkan diagram pencar (scatterplot), tampak bahwa sebaran titik-titik mengikuti pola linier
dengan kemiringan positif, yang berarti terdapat hubungan yang sejalan antara usia dengan
tekanan darah sistolik. Dengan demikian, kita bisa menggunakan koefisien korelasi untuk
menentukan apakah hubungan linier kedua variabel tersebut bermakna atau tidak. Apabila pola
hubungannya tidak linier, kita tidak tepat menggunakan koefisien korelasi karena nilai r hanya
untuk mengukur kekuatan dan arah hubungan linier antara kedua varibel kuantitatif.

Asumsi:

Kedua data berasal dari data kuantitatif. Selanjutnya apakah sebaran kedua variabel berdistribusi
normal?

Uji Formal:

H0: data berdistribusi normal

H1: data tidak berdistribusi normal

Interpretasi:

Apabila nilai sig (p-value) ≤ 0.05, maka Tolak H0 yang berarti data tidak berdistribusi normal

Apabila nilai sig (p-value) > 0.05, maka Terima H0 yang berarti data berdistribusi normal

Pada kasus di atas, nilai p-value untuk kedua variabel > 0.05, sehingga kita bisa menyimpulkan
bahwa data berdistribusi normal.

Tampak bahwa uji normalitas untuk kedua variabel tersebut memenuhi persyaratan, sebarannya
mengikuti distribusi normal, baik dengan menggunakan Uji Kolmogorov-Smirnov ataupun
Shapiro-Wilk.

Grafis:
Secara grafis juga tampak bahwa kedua variabel tersebut berdistribusi normal. Penggunaan box
plot untuk melihat apakah sebaran data berdistribusi normal ataukah tidak, diuraikan pada topik:
Mengenal Box Plot

Perhitungan nilai koefisien korelasi (r)

No Age (X) Systolic Pressure (Y) X2 Y2 XY


1 34 108 1156 11664 3672
2 43 129 1849 16641 5547
3 49 126 2401 15876 6174
4 58 149 3364 22201 8642
5 64 168 4096 28224 10752
6 73 161 5329 25921 11753
7 78 174 6084 30276 13572
Jumlah 399 1015 24279 150803 60112
Rata-rata 57 145

Pengujian Hipotesis

Metode 1:
Tentukan nilai t-tabel dengan taraf nyata (α)= 5% dan db = n-2.

Dari tabel distribusi t, kita peroleh: t(0.05/2, 5)= 2.57

Bandingkan t-hitung dengan t-tabel:

Dari hasil perhitungan, kita peroleh nilai t-hitung = 7.30 dan t-tabel = 2.57. Jelas bahwa nilai |t-
hitung| > t-tabel sehingga Tolak H0 dan Terima H1. Dengan demikian, kita bisa menyatakan
bahwa terdapat hubungan linier antara usia dengan tekanan darah sistolik.

Metode 2:

Bandingkan nilai |r| dengan nilai tabel kritis r untuk n = 7. Nilai r pada tabel kritis = 0.754.

Dari hasil perhitungan, diperoleh nilai r = 0.956. Jelas bahwa |r|> 0.754 sehingga kita bisa
menyimpulkan bahwa terdapat hubungan linier antara usia dengan tekanan darah sistolik.

Output Analisis dengan menggunakan SPSS

Kita bisa menyatakan seperti ini:

Korelasi antara usia dengan tekanan darah sistolik: r(7) = 0.956; p < 0.01

Koefisien Determinasi

Nilai koefisien determinasi diatas menyatakan proporsi keragaman Tekanan darah sistolik yang
dapat diterangkan/dijelaskan oleh hubungan linier antara variabel usia dan tekanan darah sistolik.
Berdasarkan hasil analisis, kita yakin 95% bahwa sekitar 91% variasi tinggi rendahnya tekanan
darah sistolik ditentukan oleh usia seseorang.
Cara Mencari Nilai t-Tabel dan F-Tabel Menggunakan Microsoft Excel

Untuk kepentingan pengujian hipotesa, kita sering membutuhkan nilai t dan F dari tabel yang
biasanya tersedia di buku-buku statistik atau ekonometrik. Tapi ketika sampelnya besar
(sehingga derajat bebasnya juga besar), biasanya angka tersebut tidak tersedia.
Nah, untuk mengatasi hal itu (keterbatasan sampel yang ditampilkan), kita bisa memanfaatkan
aplikasi microsoft. excel untuk mengetahui nilai t dan F tabel. Caranya sangat mudah, karena
sudah terfasilitasi dalam menu-menunya.
Misalnya untuk mencari nilai t-tabel kita tinggal menuliskan formula pada insert function atau
sel-nya =TINV(probability, deg_freedom). Namun kita tidak perlu menulis lengkap seperti itu.
Kita tinggal menggantikan nilai probability dan degree of freedom-nya saja lalu kita ENTER.
Probability diambil dari tingkat signifikan yang kita pakai, misalnya 1%, 5%, 10%, 20% dan
sebagainya. Sementara degree of freedom menunjukkan derajat bebasnya. Misalnya kita
menggunakan tingkat signifikan 5 % dan df 30, maka penulisannya =TINV(0.05, 30) dan
ENTER, maka akan muncul angka 2.0422.
Sementara itu, untuk mencari nilai F tabel formulanya adalah =FINV((probability,
deg_freedom1, deg_freedom2). Seperti di t-tabel, kita tak perlu menuliskan semua, tinggal
memasukan saja angka-angkanya. Misal jika tingkat signifikan sebesar 5%, df1 sebesar 33 dan
df2 sebesar 33, maka =FINV(0.05, 33, 33) dan ENTER, dan akhirnya akan menghasilkan angka
1.7878.

Itulah cara mudah untuk mencari nilai t dan F tabel tanpa perlu membuka-buka lampiran pada
buku-buku statistik atau ekonometrika.
Df = digree of freedom (derajat kebebasan)
n = Jumlah Sampel
K = Jumah Variabel Bebas
Bar = baris
Kol = kolom
Ho = hipotesis nol

1. Tabel r

 Df diperoleh dari n - 2
 Jika r hitung di atas r tabel maka Ho ditolak

2. Tabel Chi-square

 Df diperoleh dari (Bar - 1) X (Kol - 1)


 Jika Chi-square hitung di atas Chi-square tabel maka Ho ditolak

3. Tabel F

 Df diperoleh dari V1 = K, V2 = n - k - 1
 Jika F hitung lebih besar dari F tabel maka Ho ditolak

4. Tabel t

 Df diperoleh dari n - 1
 Jika t hitung lebih besar dari t tabel maka Ho ditolak

5. Tabel Z

 Jika Z hitung di atas Z tabel maka Ho ditolak

6. Tabel Durbin-Watson

 Df diperoleh dari Bar = n, Kol = k


 Jika DW hitung di antara U dan 4 - dU maka Ho ditolak