Você está na página 1de 31

Analisis Regresi

Dr. Ir. Tatang Sopandi., MP

Analisis regresi digunakan untuk:


Memprediksi nilai variabel dependen berdasarkan pada nilai variabel independent Menjelaskan akibat (impact) perubahan suatu variabel independen terhadao vriabal dependen

Variabel dependen: variabel tidak bebas Variabel independen: variabel bebas yang digunakan untuk menjelaskan variabel dependen

ILUSTRASI

Perbedaan mendasar antara korelasi dan regresi ?


Korelasi hanya menunjukkan sekedar hubungan. Dalam korelasi variabel tidak ada istilah tergantung dan variabel bebas. Regresi menunjukkan hubungan pengaruh. Dalam regresi terdapat istilah tergantung dan variabel bebas.

Istilah dan notasi variabel dalam regresi ?


Y
Varaibel tergantung (Dependent Variable) Variabel yang dijelaskan (Explained Variable) Variabel yang diramalkan (Predictand) Variabel yang diregresi (Regressand) Variabel Tanggapan (Response)

X
Varaibel bebas (Independent Variable) Variabel yang menjelaskan (Explanatory Variable) Variabel peramal (Predictor) Variabel yang meregresi (Regressor) Variabel perangsang atau kendali (Stimulus or control variable)

Model Regresi linear sederhana


Hanya satu variabel independen (x)
Hubungan antara variabel (x) dan (y) digambarkan dengan fungsi linear Perubahan dalam variabel (y) diasumsikan disebabkan oleh perubahan variabel (x)

Jenis model regresi


Hubungan linear positif Hubungan bukan Linear

Hubungan Linear negatif

Tidak berhubungan

Regresi linear populasi


Model regresi populasi:
Intersep population y Koefisien kemiringan populasi Variabel independen

Variabel Dependen

y 0 1x
Komponen Linear

Galat acak atau sisa

Komponen galat acak

Asumsi regresi linear


Nilai galat () secara statistik independen

Nilai galat terdistribusi normal untuk setiap nilai x


Distribusi probabilitas dari galat adalah normal Distrobusi probabilitas dari galat mempunyai variasi konstan Hubungan antara variabel x dan y adalah linear

Regresi Linear Populasi


y
Nilai pengamatan y pada xi

y 0 1x
i
Galat acak untuk nilai x
Slope = 1

Nilai prediksi y pada xi


Intercept = 0

xi

Estimasi Model Regresi

Nilai estimasi y

Estimasi intercep regresi

Estimasi slope regresi Variabel Independen

i b0 b1x y

Galat acak individual ei mempunyai nilai rata-rata 0

Persamaan Regresi
Persamaan Regresi linier Sederhana: Y = a + bX +
Y a b X = Nilai yang diramalkan = Konstansta = Koefesien regresi = Variabel bebas = Nilai Residu

n( XY ) ( X )( Y ) n( X 2 ) ( X ) 2

Y b( X ) a n

Kriteria kuadrat terkecil (Least Squares) b0 dan b1 diperoleh dengan mendapatkan nilai b0 dan b1 yang meminimalkan jumlah kuadart sisa
2 e (y y) 2

(y (b

b1x))

Persamaan kuadrat terkecil


Formulai untuk b1 dan b0 adalah :
b1 ( x x )( y y ) (x x)
2

Persamaan aljabar:

b1

x y xy n 2 ( x ) 2 x n

dan

b0 y b1 x

Interpretasi Slop dan Intersep

b0 diestimasi dari nilai rata-rata y ketika nilai x sama dengan nol b1 diestimasi dari perubahan ratarata nilai y karena perubahan satu unit x

Contoh Persamaan Regresi


Y
64 61

X
20 16

XY
1280 976

X2
400 256

Y2
4096 3721

84
70 88 92 72 77 608

34
23 27 32 18 22 192

2856
1610 2376 2944 1296 1694 15032

1156
529 729 1024 324 484 4902

7056
4900 7744 8464 5184 5929 47094

n( XY ) ( X )( Y ) n( X 2 ) ( X ) 2

8(15032 ) (192 )( 609 ) 1,497 8(4902 ) (192 ) 2

Y b( X ) a n
(608) 1,497(192) 40,082 8

Y= 40,082 + 1,497X+e

Koefesien Determinasi
Koefesien determinasi:
R 1
2

(Y Y )

2 ( Y Y ) 2

(227 ,497 ) R 1 0,743 (886 )


2

Koefesien Determinasi Disesuaikan (adjusted)


2 P ( 1 R ) R2 N P 1

Radj

Radj

1(1 0,743) 0,743 0,70 8 11

Kesalahan Baku Estimasi


Digunakan untuk mengukur tingkat kesalahan dari model regresi yang dibentuk.
Se

(Y Y )
nk

Se

(227 ,467 ) 6,1576 82

Koefisien galat baku Regresi


Digunakan untuk mengukur besarnya tingkat kesalahan dari koefesien regresi:

Sb

Se ( X ) X n
2 2

Sb1

6,1576 (4902) (192) 8


2

0,359

Uji F
Uji F digunakan untuk uji ketepatan model, apakah nilai prediksi mampu menggambarkan kondisi sesungguhnya: Ho: Diterima jika F hitung F tabel Ha: Diterima jika F hitung > F tabel

R 2 /(k 1) F 1 R 2 /(n k )

0,743 /(2 1) 17 ,367 1 0,743 /(8 2)

Karena F hitung (17,367) > dari F tabel (5,99) maka persamaan regresi dinyatakan Baik (good of fit).

Uji t
Digunakan untuk mengatahui pengaruh variabel bebas terhadap variabel tergantung.
Ho: Diterima jika t hitung t tabel Ha: Diterima jika t hitung > t tabel

Thitung

bj Sbj

t hitung

1,497 4,167 0,359

Karena t hitung (4,167) > dari t tabel (1,943) maka Ha diterima ada pengaruh iklan terhadap penjualan.

Contoh data
Harga rumah $1000s (y) 245 312 279 308 199 219 405 Luas (x) 1400 1600 1700 1875 1100 1550 2350

324
319 255

2450
1425 1700

Regression Using Excel


Tools / Data Analysis / Regression

Excel Output
Regression Statistics Multiple R R Square Adjusted R Square Standard Error Observations 0.76211 0.58082 0.52842 41.33032 10

The regression equation is:


house price 98.24833 0.10977(squarefeet)

ANOVA
df Regression Residual Total 1 8 9 Coefficien ts SS 18934.9348 13665.5652 32600.5000 Pvalue 0.1289 MS 18934.934 8 1708.1957 F 11.084 8

Significance F 0.01039

Standard Error

t Stat

Lower 95%

Upper 95% 232.0738

Presentasi grafik

450

House Price ($1000s)

400 350 300 250 200 150 100 50 0 0 500 1000 1500 2000 2500 3000 Square Feet

Slope = 0.10977

Intercept = 98.248

harga rumah 98.24833 0.10977 (luas)

Koefisien Determinasi,
SSR Jumlahkuadratregresi R SST total jumlah kuadrat
2

2 R

R r
2

R2 = koefisien determinasi r = koefiseien korelasi sederhana

Estimasi Galat baku

s
Where

SSE n k 1

SSE = jumlah kuadrat galat baku n = ukuran (jumlah) sampel k = jumlah variabel independen

b1 t /2 sb1
Excel Printout for House Prices:
Coefficient s Intercept Square Feet 98.24833 0.10977 Standard Error 58.03348 0.03297 t Stat 1.69296 3.32938 P-value 0.12892 0.01039

d.f. = n - 2

Lower 95% -35.57720 0.03374

Upper 95% 232.07386 0.18580

At 95% level of confidence, the confidence interval for the slope is (0.0337, 0.1858)

Você também pode gostar