Você está na página 1de 17

Tugas Analisis Regresi

Oleh :
Nama : Aulia Kahfi
NIM

: 14305144018

Kelas : Matematika E 2014

Universitas Negeri Yogyakarta


Tahun 2016/2017

Dasar Teori
Regresi linear sederhana adalah persamaan regresi yang menggambarkan
hubungan antara satu variabel bebas (X) dan satu variabel tak bebas (Y), dimana
hubungan keduanya dapat digambarkan sebagai suatu garis lurus. Hubungan kedua
variabel tersebut dapat dituliskan dalam bentuk persamaan:
Y = + Xi +
i

Y = Variabel tak bebas, X = Variabel bebas, 0 = intersep/perpotongan


dengan sumbu tegak, 1 = Kemiringan/gradien, i error yang saling bebas dan
menyebar normal N(0,2) i = 1, 2, , n. Dalam kenyataan seringkali kita tidak
dapat mengamati seluruh anggota populasi, sehingga hanya mengambil sampel
misalkan sampel itu berukuran n dan ditulis sebagai {(xi , yi), i = 1, 2, 3, . . ., n}.
Persamaan yang diperoleh dapat dituliskan sebagai:
Yi = b + b X
0
1
i
b0 adalah penduga untuk 0, dan b1 adalah penduga untuk 1.
~
Y
Untuk variabel bebas xi nilai pengamatan yi tidak selalu tepat berada pada garis i =
Y
0 + 1 X i (garis regresi populasi) atau i = b0 + b1 Xi (garis regresi sampel).
Analisis korelasi sederhana (Bivariate Correlation) digunakan untuk
mengetahui keeratan hubungan antara dua variabel dan untuk mengetahui arah
hubungan yang terjadi. Koefisien korelasi sederhana menunjukkan seberapa besar
hubungan yang terjadi antara dua variabel. Dalam R ada tiga metode korelasi
sederhana (bivariate correlation) diantaranya Pearson Correlation, Kendalls taub, dan Spearman Correlation. Pearson Correlationdigunakan untuk data berskala
interval atau rasio, sedangkan Kendalls tau-b,dan Spearman Correlation lebih
cocok untuk data berskala ordinal.
Pada bab ini akan dibahas analisis korelasi sederhana dengan metode Pearson
atau sering disebut Product Moment Pearson. Nilai korelasi (r) berkisar antara 1
sampai -1, nilai semakin mendekati 1 atau -1 berarti hubungan antara dua variabel
semakin kuat, sebaliknya nilai mendekati 0 berarti hubungan antara dua variabel
semakin lemah. Nilai positif menunjukkan hubungan searah (X naik maka Y naik)
dan nilai negatif menunjukkan hubungan terbalik (X naik maka Y turun).
Menurut Sugiyono (2007) pedoman untuk memberikan interpretasi koefisien
korelasi sebagai berikut:
0,00 - 0,199 = sangat rendah
0,20 - 0,399 = rendah
0,40 - 0,599 = sedang
0,60 - 0,799 = kuat
0,80 - 1,000 = sangat kuat

Regresi Ganda
Regresi linear ganda adalah persamaan regresi yang menggambarkan hubungan
antara lebih dari satu variabel bebas (X) dan satu variabel tak bebas (Y) Hubungan
variabel-variabel tersebut dapat dituliskan dalam bentuk persamaan:
Yi 0 1 X i1 2 X i 2 L p 1 X i , p 1 i
Y = Variabel tak bebas, X = Variabel bebas, 0 = intersep/perpotongan dengan
sumbu tegak, 1, 2, ...., p1 = parameter model regresi, i saling bebas dan
menyebar normal N(0,2) , i = 1, 2, , n
Yi b0 b1 X i1 b2 X i 2 L bp 1 X i , p 1
Persamaan regresi dugaannya adalah :
Hipotesis yang harus diuji dalam analisis regresi ganda adalah
H0 : 1 = 2 = = p-1=0
H1 : Tidak semua k (k=1,2,,p 1) sama dengan nol
Untuk melakukan pendugaan parameter model regresi ganda dan menguji
signifikansinya dapat dilakukan dengan bantuan software statistik.
Asumsi yang harus dipenuhi dalam analisis regresi ganda adalah :
Tidak ada multikolinearitas (korelasi antara variabel independen)
Heteroskedastisitas (variansi error konstan)
Normalitas (error berdistribusi normal)
Autokorelasi (error bersifat acak)
Multikolinearitas
Multikolinearitas atau kekolinearan ganda adalah terjadinya korelasi antar variabel
bebas. Model regresi yang baik seharusnya tidak terjadi korelasi antar variabel
bebas.
Metode yang banyak digunakan untuk mendeteksi adanya multikolinearitas adalah
faktor inflasi ragam (variance inflation factor/VIF)
Multikolinearitas terjadi jika nilai VIF > 10
Heteroskedastisitas
Ragam galat diasumsikan konstan dari satu pengamatan ke pengamatan lain, hal ini
disebut homoskedastisitas.
Jika ragam galat berbeda disebut heteroskedastisitas. Model regresi yang baik
adalah tidak terjadi heteroskedastisitas. Untuk mendeteksi heteroskedastisitas
adalah dengan membuat plot nilai dugaan yang dibakukan (standardized predicted
value) dengan sisaan yang dibakukan (studentized residual).
Jika ada pola tertentu (bergelombang, melebar kemudian menyempit) maka terjadi
heteroskedastisitas.
Jika tidak ada pola jelas, serta titik-titik (sisaan) menyebar di atas dan di bawah
angka 0 pada sumbu Y, maka tidak terjadi heteroskedastisitas.
Normalitas (error berdistribusi normal)
Untuk mendeteksi normalitas digunakan normal p-p plot.
3

Jika titik-titik (sisaan) menyebar di sekitar garis diagonal dan mengikuti arah garis
diagonal, maka model regresi memenuhi asumsi normalitas.
Jika titik-titik (sisaan) menyebar jauh dari garis diagonal dan atau tidak mengikuti
arah garis diagonal, maka model regresi tidak memenuhi asumsi normalitas
Autokorelasi
Bila dalam model regresi linear ganda ada korelasi antara galat pada periode t
dengan galat pada periode t-1, maka dinamakan ada masalah autokorelasi.
Model regresi yang baik adalah model regresi yang bebas dari autokorelasi.

X
7

y
5

10
11
8
20
9
15
5
18
22
16
13

6
10
15
17
12
13
18
16
9
7
6

Uji Regresi Linear


I.

Hipotesis = H0 : 1 = 0 ( tidak ada hubungan linear antara x dan y)


H1 : 1 0 (ada hubungan linear antara x dan y)

II.
III.
IV.

Taraf Sinifikansi () = 0.05


Kriteria Keputusan =
H0 ditolak jika p-value <
Hasil Uji R =
lm(y~x,data=akahfi2)
Call:
lm(formula = y ~ x, data = akahfi2)
Coefficients:
(Intercept)
x
10.59482
0.04456
> akahfi2.lm=lm(y~x,data=akahfi2)
> summary(akahfi2.lm)
Call:
lm(formula = y ~ x, data = akahfi2)
Residuals:
Min
1Q Median
3Q Max
-5.9067 -4.4909 -0.0404 4.1873 7.1824
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 10.59482 3.75648 2.820 0.0181 *
x
0.04456 0.27145 0.164 0.8729
---

V.

Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1


Residual standard error: 4.869 on 10 degrees of freedom
Multiple R-squared: 0.002687, Adjusted R-squared: -0.09704
F-statistic: 0.02695 on 1 and 10 DF, p-value: 0.8729
Keputusan
Dari nilai p-value 0.8729 yang lebih besar dari nilai alpha maka H0 diterima.
Artinya model regresi tidak layak atau tidak ada hubungan linear antara x dan y.

Uji Kolinearitas
I.

Hipotesis = H0 : = 0 ( tidak ada hubungan kolinear antara x dan y)


H1 : 0 (ada hubungan kolinear antara x dan y)

II.
III.
IV.

Taraf Sinifikansi () = 0.05


Kriteria Keputusan =
H0 ditolak jika p-value <
Hasil Uji R =

> cor.test(~x+y,data=akahfi2)
Pearson's product-moment correlation
data: x and y
t = 0.16415, df = 10, p-value = 0.8729
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
-0.5380702 0.6076626
sample estimates:
cor
0.05183941
V. Keputusan
Dari nilai p-value 0.8729 yang lebih besar dari nilai alpha maka H0 diterima.
Artinya model kolerasi tidak layak atau tidak ada hubungan kolinear antara x dan y.
Uji Autokorelasi
I.
Hipotesis = H0 : tidak ada hubungan autokorelasi
H1 : ada hubungan autokorelasi
II.
III.
IV.

Taraf Sinifikansi () = 0.05


Kriteria Keputusan =
H0 ditolak jika p-value <
Hasil Uji R =
> dwtest(y ~ x, alternative="two.sided", data=akahfi2)

V.

Durbin-Watson test
data: y ~ x
DW = 0.66389, p-value = 0.002738
alternative hypothesis: true autocorrelation is not 0
Keputusan
H0 ditolak karena p-value < 0.05 yaitu 0.002738 < 0.05 sehingga H1 diterima
maka ada hubungan autokorelasi.

Uji Heteroskedastisitas
I.

Hipotesis = H0 : tidak ada gejala heteroskedastisitas


H1 : ada gejala heteroskedastisitas

II.
III.
IV.

Taraf Sinifikansi () = 0.05


Kriteria Keputusan =
H0 ditolak jika p-value <
Hasil Uji R =
> bptest(y ~ x, varformula = ~ fitted.values(akahfi2.lm), studentize=FALSE,
+ data=akahfi2)
Breusch-Pagan test
data: y ~ x
BP = 0.37533, df = 1, p-value = 0.5401

V.

VI.

Keputusan
H0 diterima karena p-value > 0.05 yaitu 0.5401 > 0.05 sehingga tidak ada
gejala heteroskedastisita.
Plot

-5

R e s id u a ls

Residuals vs Fitted
8

10.8

11.0

11.2

11.4

-1 . 0 0 . 0 1 . 0 2 . 0

S t a n d a rd iz e d re s id u a ls

lm(y ~ x)

11.6

Normal Q-Q
8
5

-1.5

10.8

11.0

11.2

0.5

1.5

11.4

11.6

Residuals vs Leverage

0.0 1.0 2.0

0.5

-1 . 5

S t a n d a rd iz e d re s id u a ls

8
1

-0.5

Theoretical Quantiles

Scale-Location

0 .0 0 .4 0 .8 1 .2

Standardized residuals

Fitted values

Cook's distance
1
0.00

Fitted values

0.10

0.20

0.5

0.30

Leverage

Uji Multikolinearitas
I.

Hipotesis = H0 : tidak terjadi multikolinearitas


H1 : terjadi multikolinearitas

II.
III.
IV.

Taraf Sinifikansi () = 0.05


Kriteria Keputusan =
H0 ditolak jika VIF > 10
Hasil Uji R =
> vif(akahfi2.lm)
[4] NOTE: The dataset akahfi2 has 12 rows and 2 columns.
[5] ERROR: model contains fewer than 2 terms
8

V.

Keputusan
Uji Multikolinear tidak dapat dilakukan di data tunggal karena untuk
mengetahui adanya hubungan antara beberapa atau semua variabel yang
menjelaskan dalam model regresi.

Uji Normalitas
I.

Hipotesis = H0 : data tidak berdistribusi normal


H1 : data berdistribusi normal

II.
III.
IV.

V.

VI.

Taraf Sinifikansi () = 0.05


Kriteria Keputusan =
H0 ditolak jika p-value <
Hasil Uji R =
> with(akahfi2, shapiro.test(y))
Shapiro-Wilk normality test
data: y
W = 0.92433, p-value = 0.3238
> with(akahfi2, shapiro.test(y))
Shapiro-Wilk normality test
data: y
W = 0.92433, p-value = 0.3238
> resettest(y ~ x, power=2:3, type="fitted", data=akahfi2)
RESET test
data: y ~ x
RESET = 2.1656, df1 = 2, df2 = 8, p-value = 0.1772
Keputusan
H0 diterima karena p-value > 0.05 yaitu 0.1772 >0.05 sehingga data tersebut
berdistribusi tidak normal.
Plot

lm(y ~ x)

0
-5

11.2

2.0
1.0
1

-1.5

-0.5

0.5

1.5

Scale-Location

Residuals vs Leverage

0.4

11.0

11.2

11.4

11.6

0.5

1.0

0.0

2.0

Theoretical Quantiles

Standardized residuals

Fitted values

Fitted values

x2
9

11.6

10.8

x1
7

11.4

0.8

1.2

11.0

0.0

Standardized residuals

10.8

8
5

Cook's distance
1

-1.5

Residuals

Normal Q-Q

0.0

-1.0

Standardized residuals

Residuals vs Fitted

0.00

0.10

0.20

0.5

0.30

Leverage

Y
5

10

10
11
8
20
9
15
5
18
22
16
13

23
14
16
18
20
18
10
27
16
10
17

6
10
15
17
12
13
18
16
9
7
6

Uji Regresi Ganda


I.

Hipotesis = H0 : 1=2= 0 ( tidak ada hubungan linear antara x1,x2, dan y)


H1 : 12 0 (ada hubungan linear antara x1,x2 dan y)

II.
III.
IV.

Taraf Sinifikansi () = 0.05


Kriteria Keputusan =
H0 ditolak jika p-value <
Hasil Uji R =
> akahfi21.lm=lm(y~x1+x2,data=akahfi21)
> akahfi21.lm
Call:
lm(formula = y ~ x1 + x2, data = akahfi21)
Coefficients:
(Intercept)
8.21792

x1
-0.02507

x2
0.19821

> summary(akahfi21.lm)
Call:
lm(formula = y ~ x1 + x2, data = akahfi21)
Residuals:
Min

1Q Median

3Q

Max

-6.5261 -3.3058 -0.3368 3.1141 7.9253


Coefficients:
Estimate Std. Error t value Pr(>|t|)
11

(Intercept) 8.21792

5.29036 1.553

0.155

x1

-0.02507

0.29882 -0.084

0.935

x2

0.19821

0.30101 0.658

0.527

Residual standard error: 5.013 on 9 degrees of freedom


Multiple R-squared: 0.04853, Adjusted R-squared: -0.1629
F-statistic: 0.2295 on 2 and 9 DF, p-value: 0.7994
V.

Keputusan
Dari nilai p-value 0.7994 yang lebih besar dari nilai alpha maka H0 diterima.
Artinya model regresi tidak layak atau tidak ada hubungan linear antara x1,x2
dan y.

Uji Kolinearitas
I.

Hipotesis = H0 : 1=2 = 0 ( tidak ada hubungan kolinear antara x1,x2, dan y)


H1 : 12 0 (ada hubungan kolinear antara x1,x2, dan y)

II.
III.
IV.

Taraf Sinifikansi () = 0.05


Kriteria Keputusan =
H0 ditolak jika p-value <
Hasil Uji R =
> cor(akahfi21)
x1
x2
y
x1 1.00000000 0.3538717 0.05183941
x2 0.35387166 1.0000000 0.21859362
y 0.05183941 0.2185936 1.00000000
> with(akahfi21, cor.test(x1, y, alternative="two.sided", method="pearson"))
Pearson's product-moment correlation
data: x1 and y
t = 0.16415, df = 10, p-value = 0.8729
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
-0.5380702 0.6076626
sample estimates:
cor
0.05183941
> with(akahfi21, cor.test(x2, y, alternative="two.sided", method="pearson"))
Pearson's product-moment correlation
data: x2 and y
t = 0.70839, df = 10, p-value = 0.4949
alternative hypothesis: true correlation is not equal to 0

12

95 percent confidence interval:


-0.4062758 0.7041578
sample estimates:
cor
0.2185936
> with(akahfi21, cor.test(x1, x2, alternative="two.sided", method="pearson"))
Pearson's product-moment correlation
data: x1 and x2
t = 1.1965, df = 10, p-value = 0.2591
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
-0.2761030 0.7711603
sample estimates:
cor
0.3538717
V. Keputusan
Karena x1~y,x2~y, dan x1~x2 p-valuenya > yaitu 0.8729 ; 0.4949; 0.2591 > 0.05
maka H0 diterima sehingga tidak ada hubungan kolinear antara x1,x2, dan y.
Uji Autokorelasi
I.
Hipotesis = H0 : tidak ada hubungan autokorelasi
H1 : ada hubungan autokorelasi
II.
III.
IV.

Taraf Sinifikansi () = 0.05


Kriteria Keputusan =
H0 ditolak jika p-value <
Hasil Uji R =
> dwtest(y ~ x1 + x2, alternative="two.sided", data=akahfi21)
Durbin-Watson test
data: y ~ x1 + x2
DW = 0.84094, p-value = 0.01996
alternative hypothesis: true autocorrelation is not 0

V.

Keputusan
H0 ditolak karena p-value < 0.05 yaitu 0.01996 < 0.05 sehingga H1 diterima
maka ada hubungan autokorelasi.

Uji Heteroskedastisitas
I.

Hipotesis = H0 : tidak ada gejala heteroskedastisitas

13

H1 : ada gejala heteroskedastisitas


II.
III.
IV.

Taraf Sinifikansi () = 0.05


Kriteria Keputusan =
H0 ditolak jika p-value <
Hasil Uji R =
> bptest(y ~ x1 + x2, varformula = ~ fitted.values(akahfi21.lm),
+ studentize=FALSE, data=akahfi21)
Breusch-Pagan test
data: y ~ x1 + x2
BP = 0.11249, df = 1, p-value = 0.7373

V.

VI.

Keputusan
H0 diterima karena p-value > 0.05 yaitu 0.7373> 0.05 sehingga tidak ada
gejala heteroskedastisita.
Plot

14

Uji Multikolinearitas
I.

Hipotesis = H0 : tidak terjadi multikolinearitas


H1 : terjadi multikolinearitas

II.
III.
IV.

V.

Taraf Sinifikansi () = 0.05


Kriteria Keputusan =
H0 ditolak jika VIF > 10
Hasil Uji R =
> vif(akahfi21.lm)
x1
x2
1.143151 1.143151
Keputusan
H0 diterima karena VIF x1,x2 < 10 sehingga yang tidak terjadi
multikolinearitas.

Uji Normalitas
I.

Hipotesis = H0 : data tidak berdistribusi normal


H1 : data berdistribusi normal

II.
III.
IV.

Taraf Sinifikansi () = 0.05


Kriteria Keputusan =
H0 ditolak jika p-value <
Hasil Uji R =
> with(akahfi21, shapiro.test(y))
Shapiro-Wilk normality test
data: y
W = 0.92433, p-value = 0.3238
> with(akahfi21, shapiro.test(x2))
15

V.

VI.

Shapiro-Wilk normality test


data: x2
W = 0.95216, p-value = 0.6687
> with(akahfi21, shapiro.test(x1))
Shapiro-Wilk normality test
data: x1
W = 0.96409, p-value = 0.8402
> resettest(y ~ x1 + x2, power=2:3, type="regressor", data=akahfi21)
RESET test
data: y ~ x1 + x2
RESET = 5.1606, df1 = 4, df2 = 5, p-value = 0.05058
Keputusan
H0 ditolak karena p-value < 0.05 yaitu 0.05058 < 0.05 sehingga H1 diterima
yang artinya data tersebut berdistribusi normal.
Plot

16

Daftar Pustaka
http://duwiconsultant.blogspot.co.id/2011/11/analisis-korelasi-sederhana.html
https://tesisdisertasi.blogspot.co.id/2009/12/uji-multikolinearitas.html
TIM PPM STATISTIKA ,hand-out R,2015

17