Você está na página 1de 17

Kelas A

LAPORAN PRAKTIKUM
ANALISIS REGRESI TERAPAN
Modul 2 : Regresi

Nomor Tanggal Tanda Tangan


Nama Praktikan Praktikan
Mahasiswa Kumpul
Novendri Isra Asriny 17611040

Tanggal Tanda tangan


Nama Penilai Nilai
Koreksi Asisten Dosen
Rohmat Apriyanto
Salsabilla Novianingrum

Dina Tri Utari, S.Si., M.Sc

JURUSAN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS ISLAM INDONESIA
YOGYAKARTA
2018

i
Daftar Isi

1 Pendahuluan .................................................................................................... 1
1.1 Statistika Deskriptif .................................................................................. 1
1.1.1 Program R ......................................................................................... 1
1.2 Analisis Regresi ........................................................................................ 1
1.1 Regresi Berganda ..................................................................................... 1
1.3 Uji Hipotesis ............................................................................................. 2
1.4 Kelayakan model regresi .......................................................................... 2
2 Deskripsi Kerja................................................................................................ 4
2.1 Studi Kasus ............................................................................................... 4
2.2 Langkah Kerja .......................................................................................... 5
3 Pembahasan ..................................................................................................... 8
3.1 Pembahasan Output studi kasus nomor 1 ................................................. 8
3.2 Pembahasan Output studi kasus nomor 2 ................................................. 9
3.3 Pembahasan Output studi kasus nomor 3 ............................................... 10
3.3.1 Persamaan Regresi dan Prediksi ..................................................... 12
4 Penutup.......................................................................................................... 13
4.1 Kesimpulan ............................................................................................. 13
4.2 Saran ....................................................................................................... 13
Daftar Pustaka ....................................................................................................... 14

ii
Daftar Tabel

Tabel 2.1. Data Hotel Berbintang di Setiap Provinsi ............................................. 4

Daftar Gambar

Gambar 2.1.Double klik RStudio........................................................................... 5


Gambar 2.2.Tampilan awal RStudio. ..................................................................... 5
Gambar 2.3. Syntax penginputan data kedalam RStudio ....................................... 5
Gambar 2.4. Syntax untuk mencari statistika deskriptif ........................................ 6
Gambar 2.5. Window memilih file yang akan di input .......................................... 6
Gambar 2.6. Memasukkan data pada kolom tertentu kedalam variable................ 6
Gambar 2.7. Syntax membuat dan mencari analisis regresi berganda................... 7
Gambar 2.8. Syntax membuat dan mencari analisis regresi berganda(2) .............. 7
Gambar 2.9. Syntax membuat prediksi .................................................................. 7
Gambar 3.1. Output syntax statatistika deskriptif.................................................. 8
Gambar 3.2. Output studi kasus nomor 2 bagian analisis regresi berganda .......... 9
Gambar 3.3. Output studi kasus nomor 2 bagian analisis regresi berganda ........ 10
Gambar 3.4. Output studi kasus nomor 2 bagian ANOVA ................................. 11
Gambar 3.5. Hasil Prediksi .................................................................................. 12

iii
1 Pendahuluan

1.1 Statistika Deskriptif


Statistik deskriptif adalah metode-metode yang berkaitan dengan
pengumpulan dan penyajian suatu gugus data sehingga memberikan informasi yang
berguna. (Ronald E Walpole & Raymond H Myers, 1995)

1.1.1 Program R
R merupakan suatu sistem analisis statistika yang relatif lengkap, yang
merupakan hasil dari kolaborasi riset berbagai statistisi di seluruh dunia.
Versi paling awal R dibuat tahun 1992 di Universitas Aucland, New Zealand
oleh Ross Ihaka dan Robert Gentleman (yang mungkin menjelaskan asal
muasal akronim nama R untuk software ini). Saat ini Source Code Kernel R
dikembangkan oleh R Core Team, yang beranggotakan 17 orang statistisi dari
berbagai penjuru dunia.
R dapat diperoleh secara bebas di CRAN-archive (The Comprehensive R
Archive Network) pada alamat http:/CRAN.r-project.org. Server utama
CRAN berlokasi di Universitas Teknologi Vienna, Austria dan di mirror
world-wide lebih kurang 17 situs di lima benua. Karena R adalah sebuah
bahasa pemrograman, sebagian besar fungsi-fungsi tersedia dalam bentuk
library sesuai dengan keinginan.
(Nugraha, 2014)

1.2 Analisis Regresi


Regresi adalah suatu metode analisis statistik yang digunakan untuk melihat
pengaruh antara dua atau lebih variabel. Hubungan variabel tersebut bersifat
fungsional yang diwujudkan dalam suatu model matematis. (Nawari, 2010)

1.1 Regresi Berganda


Regresi berganda adalah model regresi atau prediksi yang melibatkan lebih dari
satu variabel bebas atau prediktor. Istilah regresi berganda dapat disebut juga
dengan istilah multiple regression. Kata multiple berarti jamak atau lebih dari satu
variabel. (Hidayat, 2017)

1
1.3 Uji Hipotesis

Uji Hipotesis adalah metode pengambilan keputusan yang didasarkan dari


analisa data, baik dari percobaan yang terkontrol, maupun dari observasi (tidak
terkontrol). Dalam statistik sebuah hasil bisa dikatakan signifikan secara statistik
jika kejadian tersebut hampir tidak mungkin disebabkan oleh faktor yang kebetulan,
sesuai dengan batas probabilitas yang sudah ditentukan sebelumnya.
Daerah kritis dari uji hipotesis adalah serangkaian hasil yang bisa menolak
hipotesis nol, untuk menerima hipotesis alternatif. Dalam pengujian hipotesis kita
harus mementukan tolok ukur penerimaan dan penolakan yang didasarkan pada
peluang penerimaan dan penolakan H0 itu sendiri.
Karena ketidaktahuan apakah H0 atau H1 yang benar maka kita harus
mencoba untuk mebuat keseimbangan dari keduanya. Umumnya kita
mengandalkan bahwa H0 benar sehingga kita diharapkan pada kesalahan I saja (α)
karena kesalahan II digunakan untuk menentukan kekuatan uji yang ditentukan.
Selang kepercayaan (1-α) sebuah parameter dalam praduga selang berkaitan
erat dengan pengujian hipotesis jika H1 ditolak dengan taraf yang nyata maka selang
kepercayaan (1-α) tidak mengandung parameter spesifik yang ditetapkan dalam H0.
(Jaka Nugraha S.Si., 2018)

1.4 Kelayakan model regresi


Model kelayakan regresi linear didasarkan pada hal-hal sebagai berikut:
a. Model regresi dikatakan layak jika angka signifikansi pada ANOVA sebesar <
0.05
b. Predictor yang digunakan sebagai variabel bebas harus layak. Kelayakan ini
diketahui jika angka Standard Error of Estimate < Standard Deviation
c. Koefesien regresi harus signifikan. Pengujian dilakukan dengan Uji T. Koefesien
regresi signifikan jika T hitung > T table (nilai kritis)
d. Tidak boleh terjadi multikolinieritas, artinya tidak boleh terjadi korelasi yang
sangat tinggi atau sangat rendah antar variabel bebas. Syarat ini hanya berlaku
untuk regresi linier berganda dengan variabel bebas lebih dari satu.
e. Tidak terjadi otokorelasi. Terjadi otokorelasi jika angka Durbin dan Watson (DB)

2
sebesar < 1 dan > 3
f. Keselerasan model regresi dapat diterangkan dengan menggunakan nilai r2
semakin besar nilai tersebut maka model semakin baik. Jika nilai mendekati 1 maka
model regresi semakin baik. Nilai r2 mempunyai karakteristik diantaranya: 1)
selalu positif, 2) Nilai r2 maksimal sebesar 1. Jika Nilai r2 sebesar 1 akan
mempunyai arti kesesuaian yang sempurna. Maksudnya seluruh variasi dalam
variabel Y dapat diterangkan oleh model regresi. Sebaliknya jika r2 sama dengan
0, maka tidak ada hubungan linier antara X dan Y.
g. Terdapat hubungan linier antara variabel bebas (X) dan variabel tergantung (Y)
h. Data harus berdistribusi normal
i. Data berskala interval atau rasio
j. Kedua variabel bersifat dependen, artinya satu variabel merupakan variabel bebas
(disebut juga sebagai variabel predictor) sedang variabel lainnya variabel
tergantung (disebut juga sebagai variabel response) (Supranto, 2004)

3
2 Deskripsi Kerja

2.1 Studi Kasus


Terdapat sebuah hotel yang memiliki data seperti di bawah ini (data) yang terdiri
dari 3 variabel.
1. Tentukan apakah antar variabel memiliki pengaruh yg kuat sehingga dapat
memberikan manfaat untuk hotel tersebut!
2. Bagaimana pemodelan regresi yang didapatkan? apakah sudah optimal?
3. Simulasikan model regresi tersebut untuk mendapatkan suatu prediksi!
Tabel 2.1. Data Hotel Berbintang di Setiap Provinsi
Provinsi Akomodasi Kamar Tempat Tidur
Aceh 20 1503 2579
Sumatera Utara 116 10732 16418
Sumatera Barat 61 3653 6015
Riau 58 5206 7832
Jambi 31 2187 2885
Sumatera Selatan 64 4781 6800
Bengkulu 9 523 786
Lampung 18 1954 2847
Kepulauan Bangka Belitung 42 2528 3653
Kepulauan Riau 88 11393 15836
DKI Jakarta 232 39806 55293
Jawa Barat 314 29053 46013
Jawa Tengah 217 17246 26878
D.I Yogyakarta 94 9256 14432
Jawa Timur 158 17014 26393
Banten 58 5939 8844
Bali 317 33599 49549
Nusa Tenggara Barat 75 4525 6721
Nusa Tenggara Timur 23 1646 2652
Kalimantan Barat 36 3821 5264
Kalimantan Tengah 12 1051 1548
Kalimantan Selatan 49 3584 5254
Kalimantan Timur 51 5468 8048
Kalimantan Utara 10 461 710
Sulawesi Utara 35 2576 3752

4
Sulawesi Tengah 8 766 1182
Sulawesi Selatan 93 6475 9420
Sulawesi Tenggara 18 1295 1959
Gorontalo 8 471 750
Sulawesi Barat 7 374 587
Maluku 22 1110 1566
Maluku Utara 3 313 492
Papua Barat 15 1014 1477
Papua 25 1684 2524

2.2 Langkah Kerja

1. Double klik pada icon RStudio pada desktop.

Gambar 2.1.Double klik RStudio


2. Akan muncul tampilan awal dari RStudio.

Gambar 2.2.Tampilan awal RStudio.


3. Memasukkan data kedalam RStudio yang mana menggunakan syntax yang di
masukkan kedalam variable.

Gambar 2.3. Syntax penginputan data kedalam RStudio

5
4. Syntax stat.desc menggunakan library pastecs untuk mencari statistika
deskriptif.

Gambar 2.4. Syntax untuk mencari statistika deskriptif


5. Setelah membuat sytax maka akan muncul window browse data

Gambar 2.5. Window memilih file yang akan di input


6. Memasukkan data pada kolom kamar kedalam variabel x1 serta data tempat
tidur kedalam variabel x2 dan data akomodasi kedalam variabel y.

Gambar 2.6. Memasukkan data pada kolom tertentu kedalam variable

6
7. Membuat rumus regresi berganda dan membuat analisis regresi berganda
yang mana untuk membuat rumus regresi berganda menggunakan syntax
lm(y~x,data=data_wisatawan)dan untuk mencari analisis regresi menggunakan
syntax summary(regresiberganda) dan anova(regresiberganda). Dengan
memuat intercept pada output-nya.

Gambar 2.7. Syntax membuat dan mencari analisis regresi berganda

8. Membuat rumus regresi berganda dan membuat analisis regresi berganda


yang mana untuk membuat rumus regresi berganda menggunakan syntax
lm(y~x1+x2-1,data=data_hotel)dan untuk mencari analisis regresi
menggunakan syntax summary(regresiberganda2) dan
anova(regresiberganda2). Yang mana berfungsi sebagai perbandingan error-
nya

Gambar 2.8. Syntax membuat dan mencari analisis regresi berganda(2)

9. Membuat rumus prediksi dari regresi berganda serta membuat data frame
agar lebih rapih

Gambar 2.9. Syntax membuat prediksi

7
3 Pembahasan

3.1 Pembahasan Output studi kasus nomor 1


Pada soal pertama, praktikan diminta untuk menganalisis deskriptif
data_hotel

Gambar 3.1. Output syntax statatistika deskriptif


Dapat di lihat pada Gambar 3.1. bahwa kolom akomodasi, kamar dan tempat
tidur memiliki data sebanyak 34 yang dapat dilihat pada dengan nbr.val, lalu
tidak memiliki nilai tidak ada sama sekali atau 0 dan juga nilai yang hilang tidak
terdapat pada akomodasi, kamar, dan tempat tidur yang di tandai dengan 0 pada
nbr.na. dapat di lihat pada akomodasi, kamar, dan tempat tidur terdapat nilai
terendahnya 3 yakni pada akomodasi, pada kolom kamar terdapat nilai terendah
3.13x102 dan tempat tidur memiliki nilai terendah 4.92x102. Pada nilai tertinggi di
kolom akomodasi sebesar 317, kamar memiliki nilai tertinggi yakni 398, dan
tempat tidur sebesar 5529. Rata-rata akomodasi dengan rumus matematikanya
yakni jumlah data pada akomodasi dibagi dengan banyaknya data sebesar 34, atau
dapat dilihat dengan sum/nbr.val sehingga di dapatkan rata-ratanya sebesar
70.205, lalu pada kamar sebesar 6853.14, dan tempat tidur sebesar 10204.68 .
Selanjutnya nilai tengah pada akomodasi sebesar 39, 3080 untuk kamar, dan 4503
untuk nilai dengah pada data tempat tidur. Untuk perhitungan error dari rata-rata
untuk akomodasi sebesar 14.314, lalu pada kamar sebesar 167.090, dan tempat

8
tidur sebesar 2460.209, lalu jarak titik antar data dapat dilihat pada output var
akomodasi sebesar 6966.835, jarak titik antar data kamar sebesar 9.492x107 , lalu
pada tempat tidur sebesar 2.057x108 . dan deviasi standarnya untuk akomodasi
sebesar 83.467, lalu pada data kamar sebesar 9.742, dan pada data tempat tidur
sebesar 1.434 .

3.2 Pembahasan Output studi kasus nomor 2

Pada studi kasus yang ke 2 yakni membuat permodelan yang di dapatkan dan
apakah sudah optimal model yang telah di dapatkan.

Gambar 3.2. Output studi kasus nomor 2 bagian analisis regresi berganda
Dapat dilihat pada gambar 3.2. bahwa didapatkan model y = 11.255659 -
0.028335x1 + 0.024810x2. Yang mana rumus matematikanya yakni y = b0 +bx1+bx2
. Permodelan dapat dikatakan sudah optimal dikarenakan β1 bernilai 7.27 x10 8 dan
β2 bernilai 3.46 x10 10 yang mana β1 dan β2 lebih kecil dari α, maka x1(kamar) dan
x2(tempat tidur) berpengaruh terhadap respon rata-rata akomodasi. Dalam kasus
ini, β0 saja yang tidak nyata.

9
3.3 Pembahasan Output studi kasus nomor 3
Selanjutnya, praktikan akan menjelaskan soal nomor dua. Di soal ini,
praktikan melakukan analisis regresi berganda yang mana menggunakan syntax
summary(regresiberganda)

Gambar 3.3. Output studi kasus nomor 2 bagian analisis regresi berganda
Uji Overall
1. Hipotesis Uji
H0: β0 = β1 = 0, dimana i = 0,1 (model tidak layak digunakan)
H1: ada minimal salah satu βi ≠ 0, dimana i = 0,1 (model layak digunakan)
2. Tingkat Signifikansi
α = 5% = 0,05
3. Daerah Kritis
Tolak jika H0 jika p-value ≤ α
4. Statistik Uji
Diperoleh p-value = 2.2 x1016
5. Keputusan
Karena nilai p-value = 2.2 x1016 < α = 0,05, maka tolak H0
6. Kesimpulan
Dengan menggunakan tingkat kepercayaan 95%, data yang ada
mendukung hipotesis H0 yang artinya model regresi layak untuk
digunakan.

10
Selanjutnya, praktikan akan menjelaskan soal nomor dua. Di soal ini,
praktikan melakukan analisis of variance antara variabel x1, x2 dan y, yang mana
vaiabel x1,x2 sebagai independent dan variabel y sebagai dependen.

Gambar 3.4. Output studi kasus nomor 2 bagian ANOVA


Uji Parsial
1. Hipotesis Uji
H0: βi = 0 , dimana i = 0,1 (koefisien regresi tidak signifikan dalam model)
H1: βi ≠ 0 , dimana i = 0,1 (koefisien regresi signifikan dalam model)

2. Tingkat Signifikansi
α = 5% = 0,05

3. Daerah Kritis
Tolak jika H0 jika p-value ≤ α

4. Statistik Uji dan keputusan


No Koefisien P-value Tanda α Keputusan
β0
1 0.000949 < 0.05 Tolak H0
(Intercept)
2 β1 7.27 x10 8 < 0.05 Tolak H0

3 β2 3.46 x10 10 < 0.05 Tolak H0

5. Keputusan
Karena nilai p-value β0, β1, β2 < α = 0,05, maka tolak H0
6. Kesimpulan
Dengan menggunakan tingkat kepercayaan 95% data yang ada
menyatakan bahwa koefisien regresi β0, β1 dan β2 signifikan terhadap
model.

11
3.3.1 Persamaan Regresi dan Prediksi
Dari pembahasan sebelumnya, diperoleh persamaan regresi berganda y =
11.255659 - 0.028335x1 + 0.024810x2. Jika diketahui data untuk banyaknya kamar
yaitu 545, 213, dan 400. data untuk banyaknya tempat tidur yaitu 69, 42, dan 771
maka akan diperoleh hasil prediksi rata-rata untuk akomodasi seperti gambar 3.5.
berikut :

Gambar 3.5. Hasil Prediksi

12
4 Penutup

4.1 Kesimpulan
1. Dapat dilihat bahwa tidak terlalu besar selisih nilai terendah antara kolom
kamar dan kolom tempat tidur yang mana menurut praktikan bahwa
hubungan antara kamar dan tempat tidur sangat berhubungan yang mana
semakin banyak kamar maka akan mempengaruhi banyak tempat tidur
namun sebaliknya jika banyak akomodasi belum tentu dapat
mempengaruhi banyaknya kamar karena boleh jadi kamar sedikit namun
pelayanan akomodasi lebih banyak (best service customer) lebih di
utamakan yang di tawarkan oleh hotel, yang mana dapat dilihat secara
lengkap pada pembahasan 3.1
2. Didapat kan permodelan y = 11.255659 - 0.028335x1 + 0.024810x2 yang
mana model dapat dikatan optimal yang mana dapat di lihat pada 3.3.1
3. Pada model yang di dapatkan dapat di prediksi kan jika nilai kamar 545
dan nilai tempat tidur sebesar 69 di dapatkan prediksi dengan akomodasi
sebesar -2.485071, lalu jika data kamar menjadi 213 dan tempat tidur 42 di
dapatkan predisksi hubungannya 6.258531, dapat dilihat lebih lengkap
pada poin 3.3.1
4. Jika mencari regresi berganda menggunakan intercept tingkat error dari
olahan data akan semakin kecil

4.2 Saran
1. Untuk mendapatkan kesalahan olahan data yang kecil, gunakan intercept
untuk meminimalisir tingkat kesalahan model.
2. Untuk melakukan statistika deskriptif dapat dilakukan dengan R yang
mana dapat dilakukan dengan cara menggunakan library pastecs lalu
menggunakan syntax stat.desc() atau juga dapat melakukannya dengan
cara manual dengan menggunakan syntax mean, median, variance, dan
sebagainya, atau juga dapat menggunakan syntax summary()

13
Daftar Pustaka

Hidayat, A. (2017, Juni 4). Penjelasan Berbagai Jenis Regresi Berganda.


Retrieved from Statistikian:
https://www.statistikian.com/2017/06/berbagai-jenis-regresi-
berganda.html
Jaka Nugraha S.Si., M. (2018). MODUL PRAKTIKUM ANALISIS DATA
EKSPLORASI. Yogyakarta.
Nawari. (2010). Analisis Regresi dengan MS Excel 2007 dan SPSS 17. Jakarta:
PT. Elex Media Komputindo.
Nugraha, D. J. (2014, Oktober 14). Pengantar Analisis Data Kategorik: Metode
dan Aplikasi Menggunakan Program R. Retrieved from Google Books:
https://books.google.co.id/books?id=gBylCgAAQBAJ&printsec=frontcov
er&dq=aplikasi+r&hl=id&sa=X&redir_esc=y#v=onepage&q=r%20progra
m&f=false
Putra, A. P. (2018, Februari 18). Belajar Data Science : Langkah Awal Mengenal
R dan RStudio. Retrieved from Medium:
https://medium.com/@mandes95/belajar-data-science-langkah-awal-
mengenal-r-dan-rstudio-198ec2246f78
Ronald E Walpole & Raymond H Myers. (1995). Ilmu Peluang dan Statistika
untuk Insinyur dan Ilmuan Edisi ke-4. Bandung: ITB.
Supranto, M. (2004). Analisis Multivariat (Arti & Interpretasi). Jakarta: Rineka
Cipta.

14

Você também pode gostar