Escolar Documentos
Profissional Documentos
Cultura Documentos
Oleh :
Dewi Rachmatin
Pendahuluan
Dalam penelitian biasanya digunakan suatu model
atau hubungan fungsional antara peubah.
Dengan model kita berusaha memahami,
menerangkan, mengendalikan dan kemudian
memprediksikan kelakuan sistem yang diteliti.
Model juga menolong peneliti dalam menentukan
hubungan kausal.
Rumusan hubungan tsb yang dinyatakan dalam
bentuk hipotesis dan diuji berdasarkan data yang
dikumpulkan kemudian.
Regresi Linear Sederhana
X adalah peubah bebas (prediktor)dan Y peubah
tak bebas yang bergantung pada Y (respons). Y
(respon) tidak dikontrol dalam percobaan.
Nilainya (y) bergantung pada satu atau lebih
peubah bebas, misalnya (nilainya) x1, x2,…,xk,
yang galat pengukurannya dapat diabaikan dan
sesungguhnya sering peubah tsb dikendalikan
dalam percobaan. Jadi peubah bebas tsb
bukanlah peubah acak tapi k besaran yang
ditentukan sebelumnya oleh peneliti dan tidak
mempunyai sifat-sifat distribusi.
Yang akan dibahas adalah regresi linear yang
menyangkut hanya satu peubah saja.
Nyatakan sampel acak ukuran n dengan himpunan :
{(xi,yi);i=1,2,…,n}. yi merupakan nilai dari peubah
acak Yi selanjutnya akan ditulis Y|x “peubah acak
yang berkaitan dengan nilai tetap x”
Rataan Y|x berkaitan linear dengan x dalam bentuk
persamaan : µY | x = α + βx
α dan β adalah dua parameter yang akan ditaksir dari
data sampel
Bila semua rataan terletak pada satu garis lurus
maka :
Yi = α + β xi + Ei
dengan asumsi : Ei galat yang bersifat acak dan
rataannya = 0 dan variansinya konstan.
Setiap pengamatan (xi,yi) dalam sampel memenuhi :
yi = α + βxi + ε i
εi adalah nilai yang dicapai Ei bila Yi berharga yi
Demikian pula persamaan regresi :
yˆ = a + bx
Tiap pasangan pengamatan memenuhi :
yi = a + bxi + ei ; ei disebut sisa
(xi,yi)
εi ei
yˆ = a + bx
µY | x = α + β x
Cara peminimuman untuk menaksir parameter
dinamakan metode kuadrat terkecil (least square
method), yaitu a dan b dicari sehingga JKG minimum
n n
JKG = ∑ e = ∑ ( yi − a − bxi )
2 2
i
i =1 i =1
∂ ( JKG ) n
= −2∑ ( yi − a − bxi )xi
∂b i =1
Samakan persamaan tsb dengan nol maka diperoleh
persamaan normal : na + b x = y
n n
∑ i ∑ i i =1 i =1
n n n
a ∑ xi + b∑ xi2 = ∑ xi yi
Sehingga diperoleh : i =1 i =1 i =1
n
n n
n∑ xi yi − ∑ xi ∑ yi
b = i =1 i =1 i =1
2
n
n
n∑ xi2 − ∑ xi
i =1 i =1
a = y − bx
Sifat Penaksir Kuadrat Terkecil
Di samping anggapan bahwa galat Ei dalam
model Yi = α + β xi + Ei
merupakan peubah acak dengan rataan nol,
misalkan selanjutnya bahwa Ei berdistribusi
normal dengan variansi sama σ2 , dan
E1, E2,…,En saling bebas dari suatu pengamatan
ke pengamatan berikutnya dalam percobaan.
Dengan asumsi kenormalan tsb kita dapat
mencari rataan dan variansi untuk penaksir α
dan β.
Misal penaksir α dan β adalah a dan b, selanjutnya
akan disebut A dan B
∑ (x − x )
i =1
i
∑ i
x 2
variansi A : σ A =
2
n
i =1
σ2
n∑ ( xi − x )
2
i =1
Taksiran takbias untuk σ2 diberikan oleh
JKG J yy − BJ xy
S =
2
=
n−2 n−2
n 2
n
∑ (Yi − Y ) − B ∑ (X i − X )(Yi − Y )
i =1 i =1
=
n−2
Selang Kepercayaan dan
Uji Keberartian
Akan diuji H0 : β = 0 (model tak linear) lawan
H1 : β ≠ 0 (model linear) dan pilih taraf
keberartian α=5% B−β
Statistik ujinya : T = S / J ~ t n − 2
xx
Tolak jika T < -tα/2 atau T > tα/2
Statistik T dapat digunakan untuk membentuk
selang kepercayaan untuk β dengan kepercayaan
(1- α)100% : t s t s
B− α /2
< β < B+ α /2
J xx J xx
Tolak H0 jika selang kepercayaan tidak memuat nol
dan sebaliknya
Uji Hipotesis untuk α :
Akan diuji H0 : α = 0 (garis melalui titik asal) lawan
H1 : α ≠ 0 (garis tidak melalui titik asal) dan pilih
taraf keberartian α=5%
A −α
Statistik ujinya : T = ~ tn−2
n
S ∑ i / nJ xx
x 2
i =1
A− i =1
<α < A+ i =1
nJ xx nJ xx
Tolak H0 jika selang kepercayaan tidak memuat nol
dan sebaliknya
Langkah Penentuan Koefisien Regresi
Linear dengan SPSS 10 for Windows
8 11.80 25.71
Kecepatan Reaksi (mol/detik) vs Suhu (Celcius)
18
16
14
kecepatan reaksi (mol/detik)
12
10
4
20 22 24 26 28 30 32
suhu (celsius)
Dari diagram pencar (plot data Y terhadap X)
terlihat bahwa kecepatan reaksi (Y) menaik
jika suhu (X) menaik, jadi ada korelasi +
antara Y dengan X
Trend (kecenderungan) data mengumpul di
sekitar suatu garis lurus
Hasil Pencocokan Model
dengan SPSS ver 10
Hasil uji t untuk H0 : α = 0 :
karena t hitung = -10.982 < -t0,025;13 = -2,160
maka H0 : α = 0 (garis melalui titik asal) ditolak.
Hasil yang sama ditunjukkan oleh nilai-p :
karena nilai-p = .000 < α , maka H0 : α = 0 (garis
melalui titik asal) ditolak.
Hasil uji t untuk H0 : β = 0 :
karena t hitung = 16.163 > t0,025;13 = 2,160
maka H0 : β = 0 (model tidak linier) ditolak.
Juga, karena nilai-p = .000 < α , maka H0 : β = 0
(model tidak linier) ditolak.
Hasil yang sama ditunjukkan oleh selang
kepercayaan, yaitu selang kepercayaan untuk α yaitu
[-28,401 , -19,064] dan selang kepercayaan untuk β
yaitu [1,170 , 1.532] keduanya tidak memuat nol
Jadi model regresi yang cocok untuk data tsb :
yˆ = −23,733 + 1,351x
Plot Data dan Garis Regresi
kecepatan reaksi (mol/detik)
18
16
14
12
10
6
Observed
4 Linear
20 22 24 26 28 30 32
suhu (celsius)
Pendekatan Analisis Variansi
Sumber JK(Jumlah dk(derajat RK(Rataan f hitung
Kuadrat) kebebasan) Kuadrat)
Variasi
Regresi JKR=bJxy 1 RKR JKR/s2
=JKR/1
Sisa JKS (JKG) n-2 RKS
=JKT-JKR s2=JKS/n-2
R =
2 JKR
=
∑ i
( Ŷ − Y ) 2
JKT ∑ i
( Y − Y ) 2
b x x x x x
x x x x xx
c x xxxxxxxx x
d x xx x xxx xx x x
-3 -2 -1 0 1 2 3
Plot a agak setangkup dan memencar, agak acak dan
lebih banyak di tengah. Tidak ada tanda bahwa
anggapan keacakan dan kenormalan dilanggar
Plot b agak aneh datanya mengelompok
Plot c terlihat satu data menyendiri di sebelah kanan
dan cukup jauh dari titik nol
Plot d tidak menunjukkan keanehan, setangkup,
memencar dan acak
Plot Sisa Menurut Besarnya
untuk contoh sebelumnya
16
14
12
10
4
NOOBS
0
-3 -2 -1 0 1 2
waktu/urutan
jika data mengumpul di sekitar dua garis yang sejajar
seperti (a), ini menunjukkan sisa tidak acak dan ada
hubungan linier
jika data mengumpul di sekitar dua garis seperti (b),
ini menunjukkan sisa tidak acak dan kesamaan
variansi dilanggar dan transformasi pada respons y
atau x mungkin diperlukan
Jika data mengumpul di sekitar dua kurva yang
melengkung seperti (c), ini menunjukkan sisa tidak
acak dan ada hubungan kuadratis
Error for Y with X from CURVEFIT, MOD_1 LINEAR
Plot Sisa vs ŷ
2
-1
-2
-3
4 6 8 10 12 14 16 18
-1
-2
-3
20 22 24 26 28 30 32
suhu (celsius)
Kesimpulan
Plot sisa vs ŷ , plot sisa vs x dan plot sisa menurut
besarnya menunjukkan pola yang sama, yaitu acak,
memencar walau sisa untuk data ke 7 cukup besar
dan memencil sendiri
Hasil uji K-S untuk sisa diperoleh nilai-p=0,360>0,05
artinya H0 : sisa berdistribusi normal diterima
Karena anggapan kenormalan dan kesamaan variansi
dipenuhi maka sisa terbaku : εi/σ berdistribusi N(0,1)
dan di bawah anggapan keacakan εi/σ , i=1,2,…,n
bebas satu sama lain
Matriks topi (proyeksi) H = X (X’X)-1 X’ “hoteling”
amat berguna dalam pemeriksaan sisa . Matriks ini
hanya tergantung pada matriks rancangan (peubah
bebas) dan tidak tergantung pada respons (Y).
Jika unsur diagonal matriks H yaitu hii besar berarti
data jauh dari pusat data.
Pengamatan yang jauh dari pusat data (peubah
bebas) berpengaruh besar terhadap koefisien regresi
dan berpotensi sebagai pencilan.
Makin besar hii makin besar pengaruh pengamatan
ke i
Makin besar ukuran sampel makin kecil pengaruh
suatu titik data, sehingga pengaruh data pencilan
dapat diabaikan
Pengukuran Berulang pada Respons