Escolar Documentos
Profissional Documentos
Cultura Documentos
X X X
(a) (b) (c)
Koefisien Korelasi (1/2)
• Kuat dan tidaknya hubungan antara x dan y apabila dinyatakan
dengan fungsi linear, diukur dengan suatu nilai yang disebut
koefisien korelasi.
• -1 ≤ r ≤ 1
Koefisien Korelasi (2/2)
• Nilai koefisien korelasi yang semakin mendekati 1
menunjukkan hubungan antara variabel x dan y semakin kuat
dan positif.
• Sedangkan nilai koefisien korelasi yang semakin mendekati -1
menunjukkan hubungan antara variabel x dan y semakin kuat
tetapi negatif.
Regresi Linear Sederhana (1/2)
• Model Regresi Linear dengan hanya melibatkan satu variabel x.
• Bentuk umum dari model regresi ini:
yi 0 1 xi i ; i = 1, 2, …, n
dimana
yi = variabel respon/dependen
xi = variabel prediktor/independen
0 = intercept
1 = slope
i = residual
• Goal: diberikan yi dan xi estimasi 0 dan 1.
Regresi Linear Sederhana (2/2)
• Salah satu metode yang paling terkenal untuk mengestimasi
parameter regresi 0 dan 1 adalah metode ordinary least
square (OLS).
• Ide dasar dari metode ini adalah meminimumkan jumlah
kuadrat residual (SSE).
Ordinary Least Square (OLS) (1/4)
e1
e2
(x2, y2)
OLS (2/4)
• Kriteria least square didefinisikan:
i2 yi 0 1 xi 2
S 0 , 1 yi 0 1 xi
2
• Estimator least square untuk 0 dan 1 , yaitu ˆ0 dan ˆ1 , harus
memenuhi
S
n
2 yi ˆ0 ˆ1 xi 0
0 ˆ0 , ˆ1 i 1
S
n
2 yi ˆ0 ˆ1 xi xi 0
1 ˆ0 , ˆ1 i 1
OLS (3/4)
• Dengan menyederhanakan kedua persamaan di atas
didapatkan persamaan normal least square:
n n
nˆ0 ˆ1 xi yi
i 1 i 1
n n n
ˆ0 xi ˆ1 xi2 xi yi
i 1 i 1 i 1
OLS (4/4)
• Dengan menyelesaikan persamaan normal ini didapatkan:
ˆ0 Y ˆ1 X
n
X X Y Y s
̂1 i 1
i i XY
X X
n 2
s XX
i 1 i
Property of LS Fit
• Jumlah kuadrat regresi (SSR):
n
SSR yˆ i y
2
i 1
i 1
i 1
ANOVA
Sumber Variasi SS DF MS Fh
Regresi SSR 1 SSR 1 MSR MSE
Residual SSE n-2 SSE (n 2)
Total SST n-1 SST (n 1)
Koefisien Determinasi
• Nilai koefisien determinasi (R2) dapat digunakan untuk
memprediksi seberapa besar kontribusi pengaruh variabel
prediktor x terhadap variabel respon y dengan syarat hasil uji F
dalam analisis regresi bernilai signifikan.
• Koefisien determinasi:
SSR
R
2
SST
Bagus jika R 2 60%
Statistik Uji
• Statistik uji yang digunakan untuk slope:
ˆ1
th
se( ˆ1 )
dimana
ˆ SSE / n 2
se( 1 )
s xx
p-value
• Nilai p (p-value) adalah ukuran probabilitas kekuatan dari bukti
untuk menolak atau menerima hipotesis null (H0).
• Semakin kecil nilai p yang diperoleh maka semakin kuat bukti
tersebut untuk menolak hipotesis null.
• Dalam aplikasinya kita biasanya membandingkan dengan nilai
alpha yang digunakan.
• Jika p-value < α, maka tolak H0, sedangkan jika p-value > α,
maka gagal tolak H0.
Interval Confidensi (CI) (1/2)
• Rentang antara dua nilai di mana nilai suatu sample mean
tepat berada di tengah-tengahnya.
• Nilai sebuah interval confidensi dapat dinyatakan
dengan kemungkinan (probability) berapa sample dalam 100
kali pengambilan samples nilai population mean sesungguhnya
akan masuk dalam sebuah rentang sample mean.
Contoh: 95% of confidence interval artinya jika saya mengambil
100 sampel maka kemungkinan 95 sampel saya akan
mencakup nilai population mean sesungguhnya.
Interval Konfidensi (CI) (2/2)
• Jadi, 100(1–α)% CI untuk 1 diberikan:
ˆ1 t 2, n2se ˆ1 1 ˆ1 t 2, n2se ˆ1
Uji Hipotesis Untuk Slope
Hipotesis untuk model regresi sederhana:
Hipotesis:
H0 : 1 0
H1 : 1 0
Kriteria Penolakan H0
Hipotesis nol (H0) ditolak jika terpenuhi salah satu kriteria
berikut:
1. th t 2, n2
2. p-value < α
3. CI tidak memuat nilai nol.
Asumsi Regresi
• Error/residual harus memenuhi asumsi identik, independen,
distribusi normal (IIDN)
• Identik : gunakan uji Glejser
• Independen: gunakan uji Durbin-Watson
• Normal : gunakan uji kolmogorov-Smirnov
Bentuk Plot Residual
Asumsi Distribusi Normal
• Hipotesis
H0 : residual berdistribusi normal
H1 : residual tidak berdistribusi normal
Contoh 1
• The Rocket Propellant Data (Montgomery, Peck, and Vining,
2012).
• Berikut adalah data tentang kekuatan dorong roket. Diketahui
bahwa kekuatan dorong roket terindikasi dipengaruhi oleh usia
mesin pendorongnya.
• Berdasarkan informasi ini:
yi = kekuatan dorong roket (psi)
xi = umur mesin pendorong (minggu)
Analisis
• Kita akan melakukan analisis yang mendalam berdasarkan
contoh 1 di atas.
• Bentuk hubungan antara kekuatan dorong dan umur mesin
pendorong digambarkan dengan scatter plot sebagai berikut.
Scatter Plot (1/2)
Sumber Variasi DF SS MS F P
Regresi 1 1527483 1527483 165.4 0.000
Error 18 166255 9236
Total 19 1693738
Sumber Variasi SS DF MS Fh
Regresi SSR 1 SSR 1 MSR MSE
Residual SSE n-2 SSE (n 2)
Total SST n-1 SST (n 1)
SSR βˆ T XT y
SST y T y
SSE y T y βˆ T XT y
Uji Hipotesis
• Uji serentak (menguji ANOVA)
Hipotesis:
H0 : 1 2 p 0
H1 : at least one of i is not equal; i = 1,…, p
• Uji individu/parsial (jika hasil uji serentak adalah tolak H0):
Hipotesis:
H0 : i = 0
H1 : i ≠ 0; i = 1 ,…, p
Contoh 2
• The delivery time data (Montgomery, Peck, and Vining, 2012)
• Berikut adalah data tentang waktu pengiriman minuman soft
drink ke vending machines (menit). Diketahui waktu
pengiriman soft drink (y), dipengaruhi oleh jumlah soft drink
yang diletakkan di vending machines (x1), dan jarak tempuh
(feet) dari perusahaan ke lokasi vending machines (x2)
Scatter Plot (1/2)
Sumber Variasi DF SS MS F P
Regresi 2 5550.82 2775.41 165.38 0.000
Error 22 233.73 10.62
Total 24 5784.54
Uji Serentak
Hipotesis:
H0 : 1 2 p 0
H1 : at least one of i is not equal; i = 1,…, p