Você está na página 1de 9

Analisis regresi dalam statistika adalah salah satu metode untuk menentukan

hubungan sebab-akibat antara satu variabel dengan variabel-variabel yang lain. Variabel
penyebab disebut dengan bermacam-macam istilah, diantaranya seperti variabel
penjelas, variabel eksplanatorik, variabel independen, atau secara bebas, variabel X
(karena seringkali digambarkan dalam grafik sebagai absis, atau sumbu X). Variabel
terkena akibat dikenal sebagai variabel yang dipengaruhi, variabel independen, variabel
terikat, atau variabel Y. Kedua variabel ini dapat merupakan variabel acak (random),
namun variabel yang dipengaruhi harus selalu variabel acak. Analisis Regresi adalah salah
satu analisis yang paling populer dan luas pemakaiannya. Hampir semua bidang ilmu yang
memerlukan analisis sebab-akibat boleh dipastikan mengenal analisis ini(1)
Adapun regresi logistik (kadang disebut model logistik atau model logit)
merupakan salah satu bagian dari analisis regresi yang digunakan untuk memprediksi
probabilitas kejadian suatu peristiwa, dengan mencocokkan data pada fungsi logit kurva
logistik. Metode ini merupakan model linear umum yang digunakan untuk regresi
binomial. Seperti analisis regresi pada umumnya, metode ini menggunakan beberapa
variabel bebas, baik numerik maupun kategorik. Misalnya, probabilitas bahwa orang yang
menderita serangan jantung pada waktu tertentu dapat diprediksi dari informasi usia, jenis
kelamin, dan indeks massa tubuh. Regresi logistik juga digunakan secara luas pada bidang
kedokteran, ilmu sosial, dan bahkan pada bidang pemasaran, seperti prediksi
kecenderungan pelanggan untuk membeli suatu produk atau berhenti berlanggannan.
Regresi logistik tidak memerlukan asumsi normalitas, heterokedastisitas, dan autokorelasi,
karena variabel terikat yang terdapat pada Regresi Logistik merupakan variabel dummy (0
dan 1), sehingga residualnya, tidak memerlukan ketiga pengujian tersebut. untuk asumsi
multikolinearitas, karena hanya melibatkan variabel-variabel bebas, maka masih perlu
untuk dilakukan pengujian. Untuk pengujian multikolinearitas ini dapat digunakan uji
kebaikan suai (goodness of fit tes) yang kemudian dilanjutkan dengan pengujian hipotesis
(uji 2), guna melihat variabel-variabel bebas mana saja yang signifikan, sehingga dapat
tetap digunakan dalam penelitian. Selanjutnya, di antara variabel-variabel bebas yang
signifikan, dapat dibentuk suatu matriks korelasi, dan apabila tidak terdapat variabelvariabel bebas yang saling memiliki korelasi yang tinggi maka dapat disimpulkan bahwa
tidak terdapat gangguan multikolinearitas pada model penelitian.
Persamaan logit bagi Regresi Logistik :
G(x) = 0 + 1x1 + 2x2 + 3x3
Persamaan untuk menentukan nilai peluang dari persamaan logit :

g (x)

e
g(x)
1+ e

(x) =

Keterangan :

(x) adalah peluang memperoleh pekerjaan bagi seorang mahasiswa

lulusan baru, jika diketahui IPK, jenis kelamin, dan usianya.


g (x) adalah nilai estimasi logit.
0, 1, 2, dan 3 berturut-turut adalah nilai koefisien untuk variabel-variabel
konstan, IPK, jenis kelamin, dan usia, yang diperoleh menggunakan metode
Maximum Likelihood Estimation.

Statistik W untuk uji signifikansi parameter Regresi Logistik :


i
SEi

W=

Wilayah kritis :
Wi > 2k,
Keterangan :

i adalah nilai koefisien regresi logistik untuk variabel ke-i


SE i adalah nilai standard error untuk variabel ke-i.

adalah banyaknya variabel bebas yang digunakan

adalah taraf nyata

Rumus untuk menentukan odds ratio :


p1 (1p 1)
p2 (1p 2)
Keterangan :

p1 adalah peluang kejadian pada kelompok pertama


p2 adalah peluang kejadian pada kelompok ke-2

Dalam melakukan analisis regresi logistik, dilakukan pengujian sebagai berikut : (2)
1. Menguji Kelayakan Hasil Regresi
Pengujian kelayakan model regresi logistik dinilai dengan menggunakan Hosmer
and Lemeshows Goodness of Fit Test Goodness yang diukur dengan nilai Chi-square.
Hosmer and Lemeshows Goodness of Fit Test Goodness menguji hipotesis nol bahwa
data empiris cocok atau sesuai dengan model (tidak ada perbedaan antara model dengan

data sehingga model dapat dikatakan fit). Jika nilai statistik Hosmer and Lemeshows
Goodness of Fit Test sama dengan atau kurang dari 0.05, maka hipotesis nol ditolak
yang berarti ada perbedaan signifikan antara model dengan nilai observasinya sehingga
Goodness of Fit Test tidak baik karena model tidak dapat memprediksi nilai
observasinya. Jika nilai statistik Hosmer and Lemeshows Goodness of Fit Test lebih
besar dari 0.05, maka hipotesis nol diterima dan berarti model mampu memprediksi
nilai observasinya atau dapat dikatakan model dapat diterima karena cocok dengan data
observasinya.
2. Menilai Keseluruhan Model (Overall Model Fit Test)
Uji ini digunakan untuk menilai model yang telah dihipotesiskan telah fit atau tidak
dengan data. Pengujian dilakukan dengan membandingkan nilai antara -2 log likelihood
pada awal (block number = 0) dengan nilai -2 log likelihood pada akhir (block number
= 1). Adanya pengurangan nilai antara -2LL awal (initial -2LL function) dengan nilai
-2LL pada langkah berikutnya (-2LL akhir) menunjukkan bahwa model yang
dihipotesiskan fit dengan data.
3. Koefisien Determinasi (R2)
Pegujian koefisien determinasi pada regresi logistik dengan menggunakan
Nagelkerkes R square. Tujuan dari pengujian ini adalah untuk mengetahui seberapa
besar kombinasi variabel independen yaitu kompetensi aparatur dan kepemimpinan
mampu menjelaskan variasi variabel dependen yaitu ketepatan waktu penyampaian
pelaporan keuangan.
4. Pengujian Simultan (Omnibus Test of Model Coefficient)
Pengujian ini dilakukan untuk menguji apakah variabel-variabel independen yang
terdiri dari kompetensi aparatur dan kepemimpinan secara simultan berpengaruh
terhadap variabel dependen yaitu ketepatan waktu penyampaian pelaporan keuangan.
Pengujian hipotesis dilakukan dengan cara membandingkan antara nilai
probabilitas (sig) dengan tingkat signifikansi (). Untuk menentukan penerimaan atau
penolakan H0 didasarkan pada tingkat signifikansi () 5% dengan kriteria :

H0 tidak akan ditolak apabila statistik Wald hitung < Chi- square tabel, dan nilai
probabilitas (sig) > tingkat signifikansi (). Hal ini berarti H alternatif ditolak atau

hipotesis yang menyatakan veriabel bebas berpengaruh terhadap variabel terikat

ditolak.
H0 ditolak apabila statistik Wald hitung > Chi-square tabel, dan nilai probabilitas
(sig) < tingkat signifikansi (). Hal ini berarti H alternatif diterima atau hipotesis
yang menyatakan variabel bebas berpengaruh terhadap variabel terikat diterima.

Analisis Regresi Logistik dapat dibedakan menjadi 2 yaitu :


a. Regresi Logistik Biner
Analisis regresi logistik biner merupakan suatu teknik untuk menganalisis data
yang peubah responnya memiliki dua kategori dengan satu atau lebih peubah bebas
yang berskala kategorik atau kontinu. Regresi logistik biner telah banyak digunakan
secara luas sebagai salah satu alat analisis pemodelan ketika variabel responnya (Y)
bersifat biner. Istilah biner merujuk pada penggunaan dua buah bilangan 0 dan 1
untuk menggantikan dua kategori pada variabel respon. Contoh variabel respon yang
dimaksud adalah kesuksesan (suksesgagal), kesetujuan (setujutidak setuju),
keinginan membeli (yatidak), terpilih atau tidak terpilih, lulus atau tidak lulus,
mendapat promosi atau tidak, dan masih banyak lagi.
Regresi logistik biner sebenarnya sama dengan analisis regresi berganda hanya
variabel terikatnya merupakan variabel dummy (0 dan 1). Sebagai contoh, pengaruh
beberapa rasio keuangan terhadap keterlambatan penyampaian laporan keuangan.
Maka variabel terikatnya adalah 0 jika terlambat dan 1 jika tidak terlambat (tepat).
Regresi logistik tidak memerlukan asumsi normalitas, meskipun screening data
outliners tetap dapat dilakukan.
Asumsi-asumsi dalam regresi logistik biner :
Tidak mengasumsikan hubungan linear antar variabel dependen dan independen
Variabel dependen harus bersifat dikotomi (2 variabel)
Variabel independen tidak harus memiliki keragaman yang sama antar kelompok

varian
Kategori dalam variabel independen harus terpisah satu sama lain atau bersifat

eksklusif
Sampel yang diperlukan dalam jumlah relatif besar, minimum dibutuhkan hingga
50 sampel data untuk sebuah variabel prediktor (bebas).

Langkah-langkah dalam penggunaan Analisis Regresi Logistik Biner adalah


1. Uji Signifikansi Model

Untuk mengetahui pengaruh variabel bebas terhadap variabel tidak bebas secara
bersama-sama (overall) di dalam model, dapat menggunakan Uji Likelihood Ratio.
Hipotesisnya adalah sebagai berikut:
Ho: 1 = 2 =.= p = 0 (tidak ada pengaruh veriabel bebas secara simultan
terhadap variabel tak bebas)
H1: minimal ada satu j 0 (ada pengaruh paling sedikit satu veriabel bebas
terhadap variabel tak bebas)
Untuk j = 1,2,,p
Statistik uji yang digunakan adalah:

Dengan :
Lo = Maksimum Likelihood dari model reduksi (Reduced Model) atau model yang
terdiri dari konstanta saja
Lp = Maksimum Likelihood dari model penuh (Full Model) atau dengan semua
variabel bebas.
Statistik G2 ini mengikuti distribusi Khi-kuadrat dengan derajad bebas p
sehingga hipotesis ditolak jika p-value < , yang berarti variabel bebas X secara
bersama-sama mempengaruhi variabel tak bebas Y.
2. Uji Parsial dan Pembetukan Model
Pada umumnya, tujuan analsis statistik adalah untuk mencari model yang cocok dan
keterpautan yang kuat antara model dengan data yang ada. Pengujian keberartian
parameter (koefisien ) secara parsial dapat dilakukan melalui Uji Wald dengan
hipotesisnya sebagai berikut:
Ho: j = 0 (variabel bebas ke j tidak mempunyai pengaruh secara signifikan terhadap
variabel tidak bebas
H1: j 0 (variabel bebas ke j mempunyai pengaruh secara signifikan terhadap
variabel tidak bebas)
Untuk j = 1,2,.,p
Dengan statistik uji sebagai berikut:

Hipotesis akan ditolak jika p-value < yang berarti variabel bebas Xj secara partial
mempengaruhi variabel tidak bebas Y.
3. Odd Ratio

Odds ratio merupakan ukuran risiko atau kecenderungan untuk mengalami


kejadian sukses antara satu kategori dengan kategori lainnya, didefinisikan sebagai
ratio dari odds untuk xj = 1 terhadap xj = 0. Odds ratio ini menyatakan risiko atau
kecenderungan pengaruh observasi dengan xj = 1 adalah berapa kali lipat jika
dibandingkan dengan observasi dengan xj = 0. Untuk variabel bebas yang berskala
kontinyu maka interpretasi dari koefisien j pada model regresi logistik adalah setiap
kenaikan c unit pada variabel bebas akan menyebabkan risiko terjadinya Y = 1,
adalah exp(c.j) kali lebih besar.
Odds ratio dilambangkan dengan , didefinisikan sebagai perbandingan dua nilai
odds xj = 1 dan xj = 0, sehingga:

Regresi logistik biner juga menghasilkan rasio peluang (odds ratios) terkait
dengan nilai setiap prediktor. Peluang (odds) dari suatu kejadian diartikan sebagai
probabilitas hasil yang muncul yang dibagi dengan probabilitas suatu kejadian tidak
terjadi. Secara umum, rasio peluang (odds ratios) merupakan sekumpulan peluang
yang dibagi oleh peluang lainnya. Rasio peluang bagi prediktor diartikan sebagai
jumlah relatif dimana peluang hasil meningkat (rasio peluang > 1) atau turun (rasio
peluang < 1) ketika nilai variabel prediktor meningkat sebesar 1 unit.
Regresi logistik biner akan membentuk variabel prediktor/respon (log (p/(1-p))
yang merupakan kombinasi linier dari variabel independen. Nilai variabel prediktor
ini kemudian ditransformasikan menjadi probabilitas dengan fungsi logit. Regresi
logistik juga menghasilkan rasio peluang (odds ratios) terkait dengan nilai setiap
prediktor. Peluang (odds) dari suatu kejadian diartikan sebagai probabilitas hasil
yang muncul yang dibagi dengan probabilitas suatu kejadian tidak terjadi. Secara
umum, rasio peluang (odds ratios) merupakan sekumpulan peluang yang dibagi oleh
peluang lainnya. Rasio peluang bagi prediktor diartikan sebagai

jumlah relatif

dimana peluang hasil meningkat (rasio peluang > 1) atau turun (rasio peluang < 1)
ketika nilai variabel prediktor meningkat sebesar 1 unit (3)
b. Regresi Logistik Multinomial
Model regresi logistik

multinomial

merupakan

suatu

model

yang

memfokuskan pengaruh sekumpulan variabel penjelas yang saling bebas terhadap


satu variabel respon. Variabel respon pada penelitian ini adalah perilaku sosial

tahanan anak yang dibagi menjadi 3 kategori yaitu rendah, sedang, dan tinggi, dimana
masing-masing diberi kode 0, 1, 2. Oleh karena itu, dalam penelitian ini digunakan
regresi logistik multinomial. Regresi logistik multinomial merupakan perluasan dari
regresi logistik biner (dua kategori) apabila variabel respon memiliki kategori lebih
dari dua dengan variabel penjelas kategorik dan/atau kontinu.
Untuk model regresi logistik multinomial, jika variabel respon dibagi menjadi
3 kategori yang masing-masing diberi kode 0,1, dan 2 dan jika kategori 0 sebagai
kategori referensi (0 = 0) maka probabilitas bersyarat dengan variabel penjelas
sebanyak p akan menghasilkan persamaan sebagai berikut :
1+exp ( 10+ 11 x 1+ + 1 p x p ) + exp ( 20+ 21 x 1 ++ 2 p x p )
1
P ( Y =0|x ) = 0 ( x )=

1+exp ( 10+ 11 x 1+ + 1 p x p ) + exp ( 20+ 21 x 1 ++ 2 p x p )


exp ( 10+ 11 x 1+ + 1 p x p )
P ( Y =1|x ) = 1 ( x )=

1+exp ( 10+ 11 x 1+ + 1 p x p ) + exp ( 20+ 21 x 1 ++ 2 p x p )


exp ( 20+ 21 x 1 ++ 2 p x p )
P ( Y =2|x )= 2 ( x )=

Suatu variabel respon dengan tiga kategori akan membentuk dua persamaan
logit, dimana masing-masing persamaan ini membentuk regresi logistik biner yang
membandingkan suatu kelompok kategori terhadap referensi, yaitu sebagai berikut:
g1 ( x )=ln

(x )
P ( Y =1|x )
=ln 1 = 10 + 11 x 1 ++ 1 p x p
P ( Y =0| x )
0 ( x )

g2 ( x )=ln

( x)
P ( Y =2|x )
=ln 2 = 20 + 21 x 1++ 2 p x p
P ( Y =0| x )
0 ( x )

Secara umum, bentuk dari fungsi logit dengan variabel respon yang terdiri dari tiga
kategori adalah:
g j ( x )= j 0 + j 1 x1 + j 2 x 2++ jp x p ; j=0,1,2
Jika terdapat variabel penjelas dengan skala kategorik, variabel tersebut tidak tepat
apabila dimasukan kedalam model karena angka tersebut hanya sebagai identifikasi

saja dan tidak mempunyai nilai numerik. Agar variabel penjelas tersebut dapat masuk
kedalam model, maka dilakukan transformasi dengan memeasukkan variabel boneka
(dummy variable) ke dalam model. Misalkan variabel penjelas ke-m, yaitu
yang mempunyai kategori sebanyak
sebanyak

hm

xm

, maka akan terdapat variabel boneka

hm 1 . Dengan demikian, fungsi logistik dengan

p variabel penjelas

dan m variabel boneka akan menjadi:


jmv D jmv + + jp x p
hm 1

g j ( x )= j 0 + j 1 x1 + j 2 x 2++
v=1

Dimana

D jmv

= variabel boneka dari variabel ke- m fungsi logit ke- j

Secara umum, langkah-langkah yang dilakukan dalam analisis regresi


logistik multinomial adalah:
1

Melakukan pengujian parameter secara simultan untuk mengetahui kecocokan model

analisis tersebut.
Melakukan pengujian parameter secara parsial untuk mengetahui variabel bebas yang

paling berpengaruh dalam model tersebut.


Melakukan interpretasi terhadap nilai rasio kecenderungan yang terbentuk.

DAFTAR PUSTAKA
1

Farida, Ainun. 2015. Regresi Logistik Ordinal. Artikel E-Buletin : LPMP Sulawesi

Selatan.
Kutner, M.H., C.J. Nachtsheim dan J. Neter. Applied Linear Regression Models. Fourth

Edition. The McGraw-Hill Companies, Inc. Singapore.


Agresti, Alan, (1990), Categorical Data Analysis, John Wiley and Sons, Inc, New York.

Você também pode gostar