Escolar Documentos
Profissional Documentos
Cultura Documentos
PENDAHULUAN
1
BAB II
KAJIAN PUSTAKA
Analisis regresi yang mengkaji hubungan antara satu variabel tak bebas
dengan beberapa variabel bebas, dinamakan analisis regresi berganda. Model pada
analisis regresi berganda adalah:
= konstanta regresi
= banyaknya pengamatan
2
Semakin besar nilai maka taksiran model regresi yang diperoleh semakin baik
dan sebaiknya jika nilai semakin kecil maka taksiran model regresi yang
diperoleh tidak baik.
Pada regresi berganda, variabel akan bergantung pada dua atau lebih
variabel bebas dengan kata lain variabel yang terjadi pada variabel tak bebas
dipengaruhi oleh lebih dari satu variabel bebas. Masalah penting dalam penerapan
analisis regresi berganda adalah pemilihan variabel-variabel bebas yang dapat
digunakan dalam model agar diperoleh persamaan regresi terbaik yang
mengandung sebagian atau seluruh variabel bebas.
Asumsi yang harus dipenuhi dalam analisis regresi linier berganda yaitu:
3
Asumsi Kebebasan Sisaan
Asumsi Kebebasan Sisaan bertujuan untuk mengetahui apakah
terdapat ketergantungan diantara sisa. Uji formal untuk uji kebebasan nilai
sisaan dengan menggunakan uji DurbinWatson, akan tetapi dengan
menggunakan uji grafik dapat dilakukan dengan membuat plot antara nilai
sisaan denga periode jika polanya acak maka dapat dikatakan sisaan
tersebut bebas satu sama lainnya atau dapat juga dengan membuat plot
autokorelasi antar sisaan atau saling bebas. Selain itu, dapat juga dengan
melihat lag pertama pada autokorelasi sisaan yakni jika lag pertama
signifikan maka nilai sisaan tersebut bebas.
4
Statistik uji yang digunakan adalah uji F. Uji F pada dasarnya menunjukan
apakah semua variabel bebas yang dimasukan dalam model mempunyai pengaruh
secara bersama-sama terhadap variabel tak bebas.
Jumlah kuadrat regresi dapat digunakan sebagai petunjuk apakah model
sudah menggambarkan keadaan sesungguhnya atau sebaliknya. Uji F didefinisikan
sebagai berikut:
dan
Dimana
dii = entri dari baris ke-i dan kolom ke-j matriks ei
=
dengan hipotesisnya adalah sebagai berikut:
5
b. Pengujian Parameter
Pengujian ini bertujuan untuk menentukan signifikasi suatu variabel
bebas dalam model. Dengan kata lain, perlu tidaknya variabel tersebut
berada dalam model. Hipotesis untuk pengujian ini adalah:
i = 1,2,...,k
2.4 Multikolinearitas
Multikolinearitas adalah kejadian yang muncul di dalam model regresi jika
satu variabel atau variabel bebas berkorelasi sangat tinggi sehingga sulit untuk
memisahkan pengaruh mesing-masing kedalam variabel tak bebas. metode yang
dapat digunakan untuk melihat ada tidaknya multikolinearitas dalam suatu
persamaan regresi, yaitu :
a. Koefisien Korelasi antar Variabel Bebas
Cara yang paling mudah dan sederhana unuk mengetahui ada tidaknya
korelasi anatar variabel bebas dengan melihat korelasi antara dua variabel
bebas. Kolinearitas terjadi jika r dekat dengan , dan tidak terjadi jika r =
0.
6
Metode lain untuk mengetahui multikolinearitas adalah menghitung
besarnya multikolinearitas tiap variabel bebas dengan faktor keragaman
inflasi (VIF). VIF didefinisikan sebagai berikut:
dimana :
= vektor ciri
=1
=
Sedemikian sehingga variabel-variabel saling bebas satu sama lain
dan variabel baru menjelaskan sebesar mungkin proporsi keragaman dari vektor
variabel penjelas asal (Suryanto, 1998:201)
7
2.6 Cara Menentukan Komponen Utama
Ada dua cara menentukan komponen utama yaitu:
1. Menggunakan Matriks Ragam Peragam (Varian Covarian)
=
=
=
disebut komponen utama dari . Jika matrik ragam
peragam dari variabel asal dilambangkan dengan , maka didapatkan
ragam dan peragam dari masing-masing komponen utama yaitu:
8
=
=
1,2,...,k
Misal S
matrik
ragam
peragam atau
varian kovarian. Menurut
Suryanto(1998), S didefinisikan sebagai berikut:
9
yang sudah mencakup semua variabel. Beban untuk komponen utama
adalah koefisien korelasi momen hasil kali antara dan . Jika beban
ini dinyatakan dengan tanda , maka
(Suryanto,1998:208).
2. Menggunakan Matrik Korelasi
Bila komponen utama dihasilkan dari matrik ragam-ragam maka
komposisi dari komponen utama tergantung pada satuan pengukuran
yang tidak sama yaitu dengan membentuk komponen utama dari matrik
korelasi.
Bila k variabel asal diukur dengan satuan pengukur berbeda maka
variabel tersebut ditransformasikan ke dalam skor baku. Pembakuan
variabel asal X ke dalam skor Z dapat diakukan dengan menggunakan
rumus:
Dengan demikian komponen utama Z dapat ditentukan dari vektor ciri matrik
korelasi variabel asal R sehingga komponen utama ke-j adalah:
10
2.6 Skor Komponen Utama
Jika komponen utama dihasilkan dari matrik korelasi R, maka matrik data
individu digantikan dengan matrik data skor baku yaitu:
11
Prinsip utama dari teknik regresi komponen utama adalah meregresikan skor
komponen utama yang terpilih dengan variabel respon, sehingga dihasilkan model
regresi komponen utama dinyatakan dalam persamaan berikut:
.............(1)
Dimana :
= konstanta
= faktor galat
Setiap komponen utama dalam persamaan (1) merupakan kombinasi linier dari
semua variabel penjelas X yang dinyatakan dinyatakan dalam hubungan:
= =
.........
= .................(2)
Apabila persamaan (2) disubstitusikan ke dalam persamaan (1) diperoleh
persamaan baku:
.................................(3)
dengan : =
= =
........................................................
12
= ..................................(4)
Ragam dari koefisien regresi komponen utama untuk persamaan dapat
ditentukan sebagai berikut:
dengan adalah ragam galat dari model regresi asli atau dapat diduga dari ragam
galat untuk model regresi komponen utama. Untuk melihat ragam dari koefisien
regresi c dalam persamaan tersebut adalah dengan memanfaatkan hubungan antara
koefisien regresi dari variabel asal Xi dengan koefisien ciri dari setiap komponen
utama, yaitu:
( )
13
BAB III
PEMBAHASAN DAN ANALISA
3.1 Pembahasan
Masalah yang akan dibahas yaitu mengenai faktor-faktor yang
mempengaruhi jumlah tekanan darah tinggi. Data terdiri dari satu variabel terikat
Y dan tujuh variabel bebas X1, X2,X3,X4,X5,X6, dan X7.
Berikut data yang digunakan dalam analisis regresi komponen utama yang
terdiri dari Jumlah tekanan darah, usia,berat badan, kadar glukosa, kadar kolesterol
total, kadar kolesterol HDL, kadar kolesterol LDL, dan kadar trigliserida.
Variabel bebas : X1 = Usia
X2 = Berat badan (kg)
X3 = Kadar Glukosa (mg/dl)
X4 = Kadar Kolesterol Total (mg/dl)
X5 = Kadar Kolesterol HDL (mg/dl)
X6 = Kadar Kolesterol LDL (mg/dl)
X7 = Kadar Trigliserida (mg/dl)
Variabel Terikat: Y = Jumlah Tekanan Darah Tinggi (mmHg)
Tabel. 1.
Y X1 X2 X3 X4 X5 X6 X7
160 46 75 278 180 35 198 125
150 51 68 254 210 56 211 177
170 58 57 275 165 71 121 134
165 49 55 202 169 36 179 118
155 60 59 107 150 45 210 337
155 55 60 118 216 50 134 120
175 57 75 184 240 62 200 107
150 45 60 190 185 30 190 183
160 47 72 222 200 45 189 153
175 62 79 295 90 65 200 160
14
160 46 81 193 205 72 140 113
145 52 60 122 108 80 175 168
165 47 59 54 222 36 181 154
200 66 73 239 215 40 190 160
160 57 66 180 180 35 180 335
180 49 64 211 210 55 124 400
190 61 66 130 170 40 150 119
165 54 62 142 106 35 135 215
205 62 70 120 217 50 170 405
175 58 68 190 191 44 190 168
185 60 65 111 175 32 200 164
185 52 64 89 215 27 187 106
175 57 75 184 109 62 200 184
150 45 60 264 185 30 190 183
160 47 72 222 200 45 189 153
175 62 79 295 90 65 200 160
160 46 81 193 205 72 140 113
145 52 60 122 108 80 175 168
165 52 59 54 222 36 181 154
200 66 73 239 215 40 190 160
160 57 66 94 180 35 180 335
180 58 71 211 210 55 124 400
190 61 66 166 170 40 150 119
165 54 62 174 106 35 135 123
205 62 70 264 217 50 170 405
Sebelum mencari model untuk regresi linear berganda, terlebih dahulu kita
harus mengetahui hubungan penyakit darah tinggi dengan faktor-faktor yang
mempengaruhi, sehingga harus diketahui persamaan regresinya. Maka analisis
regresi berganda adalah tahap awal yang dilakukan dalam memperoleh model
regresi linier berganda.
15
The regression equation is
Y = 40,8 + 1,90 X1 + 0,631 X2 + 0,0106 X3 + 0,107 X4 - 0,298 X5 - 0,137
X6 + 0,0014 X7
Analysis of Variance
Unusual Observations
Dari hasil minitab di atas dapat diketahui jika persamaan regresinya adalah
Y = 40,8 + 1,90 X1 + 0,631 X2 + 0,0106 X3 + 0,107 X4 - 0,298 X5 - 0,137 X6 +
0,0014 X7 dengan R-Sq = 73,4% R-Sq(adj) = 66,5%
Setelah persamaan regresi linier berganda diketahui, maka dilakukan
pengujian asumsi, yaitu:
Uji kenormalan nilai sisaan
16
Dari grafik normal plot residual terlihat bahwa grafik membentuk garis
lurus dengan sudut 45o , dengan menggunakan uji Anderson-Darling nilai P-value
0,014 itu berarti P-value < 0,05 sehingga menyebabkan H0 ditolak dan menunjukan
bahwa data tidak berdistribusi normal, dengan kata lain asumsi ini tidak dipenuhi.
Uji kehomogenan nilai sisaan
17
Pada Fitted Line Plot di atas antara nilai sisaan baku dengan nilai dugaan,
terlihat plot menyebar dari -2 sampai 2, sehingga asumsi kehomogenan nilai sisaan
terpenuhi.
Uji kebebasan nilai sisaan
Jika dilihat dari grafik autokorelasi, terlihat bahwa lag pertama signifikan
sehingga dapat disimpulkan bahwa nilai sisaannya bersifat acak. Dengan demikian
asumsi nilai sisaan terpenuhi.
Selanjutnya pengujuan koefisien regresi yang dapat dilihat pada tabel
berikut:
Tabel 2. Pngujian Koefisien Regresi secara Serentak
Sumber Derajat Bebas Jumlah Kuadrat Fhitung
Variasi (db) Kuadrat (JK) Tengah (KT)
18
Tabel 3.Pengujian Koefisien Regresi secara Individual
Variabel Bebas Koefisien Simpangan Baku Thitung
X1 1,9027 0,2850 6,68
X2 0,6311 0,2941 2,15
X3 0,01056 0,02871 0,37
X4 0,10666 0,04287 2,49
X5 -0,2978 0,1303 -2,28
X6 -0,13670 0,06630 -2,06
X7 0,00135 0,01849 0,07
Selanjutnya Identifikasi Multikolinieritas dapat dilihat dari analisis korelasi
antara variabel bebas X1, X2,X3,X4,X5,X6, dan X7 dengan variabel tak bebas Y, hasil
uji data dapat dilihat sebagai berikut:
Dari matriks korelasi dapat diketahui variabel yang mempunyai nilai Pvalue
kurang dari = 0,05 adalah dan terjadi kasus multikolinier dapat
dilihat dengan membandingkan koefisien korelasi antara variabel bebasnya dengan
koefisien korelasi antara X5,X6, dan X7 dengan Y
Pada hasil uji di atas terlihat bahwa koefisien korelasi
lebih besar dari . Koefisien korelasi lebih besar dari dan
19
koefisien korelasi lebih besar dari . Sehingga dapat disimpulkan adanya
kasus multikolinearitas antar variabel bebas. Adanya kasus tersebut dapat di atasi
dengan analisis regresi komponen utama.
Langkah pertama pada analisis regresi komponen utama adalah
menstranformasikan variabel-variabel bebas ke dalam variabel baku Z dimana
hasilnya dapat dilihat pada tabel berikut:
Tabel 4. Tabel Variabel Baku Z
Z1 Z2 Z3 Z4 Z5 Z6 Z7
-1,36887 1,07632 1,41981 0,04225 -0,87 0,90389 -0,71483
-0,57827 0,11039 1,06294 0,73549 0,5171 1,3866 -0,17343
0,52857 -1,4075 1,3752 -0,30437 1,50788 -1,95525 -0,62113
-0,89451 -1,68348 0,28974 -0,21193 -0,80395 0,19839 -0,78772
0,84482 -1,13152 -1,12285 -0,65098 -0,20948 1,34947 1,49244
0,05421 -0,99353 -0,95928 0,87414 0,12078 -1,47253 -0,76689
0,37045 1,07632 0,02209 1,42873 0,91341 0,97815 -0,90224
-1,52699 -0,99353 0,11131 0,15779 -1,20026 0,60684 -0,11096
-1,21075 0,66235 0,58713 0,50441 -0,20948 0,56971 -0,42331
1,16106 1,62828 1,67259 -2,03746 1,11157 0,97815 -0,35043
-1,36887 1,90426 0,15592 0,61995 1,57393 -1,24974 -0,83977
-0,42015 -0,99353 -0,89981 -1,62152 2,10235 0,04986 -0,26713
-1,21075 -1,13152 -1,91092 1,01279 -0,80395 0,27265 -0,4129
1,79354 0,80034 0,8399 0,85103 -0,53974 0,60684 -0,35043
0,37045 -0,16559 -0,03739 0,04225 -0,87 0,23552 1,47161
-0,89451 -0,44157 0,42356 0,73549 0,45104 -1,84385 2,14837
1,00294 -0,16559 -0,78085 -0,18883 -0,53974 -0,87843 -0,7773
-0,10391 -0,71755 -0,60242 -1,66774 -0,87 -1,4354 0,22221
1,16106 0,38637 -0,92955 0,89725 0,12078 -0,1358 2,20043
0,52857 0,11039 0,11131 0,29644 -0,27553 0,60684 -0,26713
0,84482 -0,30358 -1,06337 -0,07329 -1,06816 0,97815 -0,30878
-0,42015 -0,44157 -1,39049 0,85103 -1,39842 0,49544 -0,91266
0,37045 1,07632 0,02209 -1,59841 0,91341 0,97815 -0,10055
-1,52699 -0,99353 1,21164 0,15779 -1,20026 0,60684 -0,11096
-1,21075 0,66235 0,58713 0,50441 -0,20948 0,56971 -0,42331
1,16106 1,62828 1,67259 -2,03746 1,11157 0,97815 -0,35043
-1,36887 1,90426 0,15592 0,61995 1,57393 -1,24974 -0,83977
-0,42015 -0,99353 -0,89981 -1,62152 2,10235 0,04986 -0,26713
-0,42015 -1,13152 -1,91092 1,01279 -0,80395 0,27265 -0,4129
20
1,79354 0,80034 0,8399 0,85103 -0,53974 0,60684 -0,35043
0,37045 -0,16559 -1,31615 0,04225 -0,87 0,23552 1,47161
0,52857 0,52436 0,42356 0,73549 0,45104 -1,84385 2,14837
1,00294 -0,16559 -0,24556 -0,18883 -0,53974 -0,87843 -0,7773
-0,10391 -0,71755 -0,1266 -1,66774 -0,87 -1,4354 -0,73566
1,16106 0,38637 1,21164 0,89725 0,12078 -0,1358 2,20043
Dari hasil uji tersebut terlihat bahwa komponen PC1, PC2, PC3, dan PC4
yang memiliki eigenvalue lebih dari 1 yaitu 1,815, 1,2605, 1,2229, 1,0819.
Komponen PC1 ini dapat menjelaskan 25.9% keragaman data, komponen PC2
dapat menjelaskan 18% keragaman data, komponen PC3 dapat menjelaskan 17,5%
data, dan PC4 dapat menjelaskan 15.5% data.Sehingga nilai untuk komponen dapat
dihitung dengan melihat nilai koefisien untuk masing-masing variabel sebagai
berikut:
21
0,580617 -0,05614 -0,26792 -0,29297 -0,29024 0,0696 -0,64268
0,549086 0,022873 -0,16507 -0,19889 0,619236 -0,36908 0,333914
-0,26101 -0,17478 -0,36851 -0,71428 -0,31115 -0,01139 0,397978
0,481684 0,110011 0,488637 -0,09215 -0,283 0,481228 0,44379
0,092857 0,076237 -0,71077 0,411746 0,041515 0,509615 0,222277
-0,06945 -0,7439 0,138701 -0,13409 0,426431 0,451257 -0,13817
22
0,916567 -1,05336 -1,49013 0,073211 -0,69196 -1,09867 0,456083
-1,24826 -1,43335 -0,15883 0,411938 -0,05012 0,689228 -0,76915
0,357463 -2,1694 1,323976 -1,63515 0,374073 -0,09532 -0,28927
-0,24999 -0,14135 0,362677 0,436085 -0,67617 -1,38292 -0,15023
-0,57482 0,736248 1,325424 0,971789 0,564777 -1,4243 -0,87196
0,802036 -2,51399 -0,22507 -0,88072 0,776189 0,081327 0,496558
Analysis of Variance
Unusual Observations
Sehingga didapat juga hasil uji regresi secara serentak sebagai berikut:
23
Tabel 7. Pengujian Koefisien Regresi Komponen Utama secara Serentak
Sumber Derajat Bebas Jumlah Kuadrat Fhitung
Variasi (db) Kuadrat (JK) Tengah (KT)
24
X1 0,717523 0,008872 7,62
X2 0,322369 0,013758 2,75
X3 0,023671 0,019667 0,17
X4 0,073143 0,009886 0,74
X5 0,12768 0,015662 1,02
X6 0,019382 0,010454 0,19
X7 0,058367 0,008411 0,64
Uji koefisien regresi secara Individual (uji T) dengan hipotesis sebagai berikut:
: j 0
: j 0
Ci VarC KTS q 2
Thitung i ijj
VarCi JKT j 1
0,008872 7,6178
0,013758 2,7485
0,019667 0,1688
0,009886 0,7356
0,015662 1,0202
0,010454 0,1896
0,008411 0,6364
Nilai -1,28566 dengan derajat bebas (34), karena seluruh
koefisien -1,28566 maka tolak sehingga dapat
disimpulkan koefisien masing-masing variabel tidak sama dengan nol (signifikan)
Dari uji asumsi residual dan uji koefisien regresi dapat diperoleh model untuk data
tersebut adalah:
Y = 84,97767 + 0,7175X1 + 0,3223X2 +0,02367X3 +0,07314X4 +0,1276X5
+0,0019382X6 +0,058367 X7
25
Dari model tersebut dapat kita lihat bahwa variabel Y dapat diterangkan oleh
skor komponen utama sebesar 73,4% dan sisanya ditengkan oleh variabel lain di
luar model . Berdasarkan pemilihan model dari K1, K2, K3, dan K4 dengan
keragaman data 78,7% maka faktor dominan yang mempengaruhi penyakit
hipertensi yaitu : Usia, berat badan, kadar glukosa, dan kadar kolesterol total.
26
BAB IV
KESIMPULAN
4.1 Kesimpulan
Salah satu cara untuk mengatasi kasus multikolinearitas dalam analasis
regresi berganda adalah menggunakan metode regresi komponen utama yang
merupakan kombinasi analisis regresi berganda dengan analisis komponen utama.
Dari data faktor-faktor yang mempengaruhi jumlah darah tinggi dalam
tubuh didapatkan model regresi berganda sebagai berikut:
27
DAFTAR PUSTAKA
28