Você está na página 1de 10

ANALISA REGRESI LOGISTIK DALAM ILMU EKONOMI

Dalam model regresi dimana variabelnya bersifat kualitatif, maka variable tersebut
harus dikuantifikasikan agar dapat diregres dengan diberi atribut yang bersifat artificial
(dummy ) dengan mengambil 1 ( adanya atribut ) atau 0 ( tidak adanya atribut ).
Ketika satu atau lebih variable bebas bersifat kualitatif didalam model regresi, maka
dapat digunakan regresi linear dengan variable bebas dummy untuk mengestimasi model ini.
Namun, mengestimasi model dengan variable tidak bebas ( dependen ) bersifat kualitatif
sangat berbeda. Model respon kualitatif ingin mencari hubungan suatu variable (independen )
dengan probabilitanya untuk membuat keputusan yang bersifat dkotomi atau binary.
Cummukative Distribution Function ( CDF )
Adalah sebuah model yang mampu menjamin bahwa nilainya terletak antara 0 dan 1
sehingga dapat membuat model regresi dimana respon dari variable dependen bersifat
dikotomis.
Secara spesifik CDF memenuhi dua sifat, yakni :
Ketika Xi naik, maka Pr ( Yi = 1/Xi ) akan naik pula tetapi tidak pernah keluar
dari interval 0-1
Hubungan antara Pi dan Xi adalah non linear sehingga tingkat perubahannya
tidak sama tetapi kenaikannya semakin besar dan kemudian semakin kecil.
Ketika nilai probabilitanya mendekati 0 tingkat penurunannya semakin kecil,
begitu pula ketika nilai probabilitanya mendekati 1 tingkat kenaikannya
semakin mengecil.
Ada 2 model yang memenuhi CDF, yaitu model probit berkaitan dengan fungsi
probabilita distribusi normal, dan model logit berkaitan dengan fungsi probabilita distribusi
logistik.






P
1
probit

logit

- ~ 0 + ~
Model Regresi Logistik

Untuk kasus satu variable bebas, model regresi logistic sbb :

Pi =

(1)



Pi =

(2)

dimana B0 dan B1 merupakan parameter yang diestimasi, X adalah variable bebas,
dan e adalah logaritma natural yang bernilai 2, 728 dan Pi adalah probabilitas suatu kejadian.

Untuk lebih dari satu variable bebas, sbb :

Pi =

(3)
atau
Pi =

(4)
Dimana Z adalah persamaan linear :
Zi = B
0
+ B
1
X
1
+ B
2
X
2
+ ..+ BpXp

Agar persamaan (4) dapat diestimasi, maka persamaan tersebut dimanipulasi dengan
cara mengalikannya dengan 1+

pada kedua sisinya, sehingga diperoleh persamaan


berikut :
[ 1+

] Pi = 1 (5)
Bagi persamaan (5) dengan Pi 1, diperoleh :

(6)

atau dalam bentuk lain :

(7)

Angka ini disebut odd atau risiko yaitu perbandingan antara probabilita terjadinya
suatu peristiwa dengan probabilita tidak terjadinya suatu peristiwa.
Bila odd ini ditransformasikan menjadi model logarithma natural sehingga
menghasilkan persamaan sbb :
Zi =ln

(8)
jadi, model logit :
Zi =ln

= B
0
+ B
1
X
1
+ B
2
X
2
+ + BpXp (9)

B
0
menyatakan log odd pada saat X
1
, X
2
, ., X
p
sama dengan nol. B
2
menyatakan
perubahan dalam Z bila X
1
berubah 1 unit. Dengan kata lain B
2
menunjukkan bagaimana log
odd berubah bila X
1
berubah 1 unit.
Persamaan (9) dikenal dengan model logit. Nilai Z terletak antara -~ sampai +~, Pi
terletak antara 0 dan 1. Pi adalah non linear terhadap Zi ( dengan demikian Pi tidak hanya non
linear terhadap X tetapi juga terhadap parameternya atau Bi ).
Aplikasi Model Logistik
Dalam menganalisa masalah masalah dalam ekonomi ketenagakerjaan dan
kependudukan, seringkali digunakan teknik logit untuk menganalisanya. Untuk itu, pada
bagian ini dilihat Faktor - Faktor yang Mempengaruhi Pekerja Anak Indonesia. Untuk
menganalisa ini, digunakan model logit dengan variable variable sbb :
Variabel Terikat ( Dependent Variable ) :
Proporsi anak yang bekerja dalam suatu keluarga (P)
- P = 1, anak bekerja
- P = 0, anak tidak bekerja

Variabel Bebas ( Independent Variables ) :
1. Tempat Tinggal (TT)
- Desa ( pembanding )
- Kota
2. Jenis Kelamin (JK)
- Perempuan ( pembanding )
- Laki laki
3. Pendidikan (PD)
- Tidak Tamat SD ( Pembanding )
- Tamat SD
- SLTP
- SMU ke atas
4. Status Pekerjaan Utama (SP)
- Informal ( pembanding)
- Formal
5. Lapangan Pekerjaan (LP)
- Jasa ( pembanding )
- Industri manufaktur
- Pertanian

Pembentukan Model :
Zi = ln

= B
0
+ B
1
TT + B
2
JK + B
3
PD + B
4
SP + B
5
LP +
Sumber Data :
Data diolah dari hasil Sakernas 1994 dengan ukurn sampel sebanyak 65.664
rumah tangga yang terdiri dari 27.040 rumah tangga yang tinggal di perkotaan dan
38.624 rumah tangga yang berdomisili di pedesaan.
Definisi variable :
Tempat Tinggal (TT) = 1, bila resp. tinggal diperkotaan
= 0, bila resp. tinggal di pedesaan
Jenis Kelamin (JK) = 1, untuk resp. laki-laki
= 0, untuk resp. perempuan
Pendidikan (PD) :
Pendidikan 1 (PD1) = 1, bila pendidikan tertinggi resp. SD
= 0, lainnya
Pendidikan 2 (PD2) = 1, bila pendidikan tertinggi resp. SLTP
= 0, lainnya
Pendidikan 3 (PD3) = 1, bila pendidikan tertinggi resp. SMU
= 0, lainnya
Status Pekerjaan (SP) = 1, bila resp. Bekerja di sektor formal
= 0, bila resp. bekerja di sektor informal
Lapangan Pekerjaan (LP) :
Lap. Pekerjaan 1 (LP1) = 1, bila resp. bekerja di skctor Pertanian
= 0, lainnya
Lap. Pekerjaan 2 (LP2) = 1, bila resp. bekerja di sektor Industri
= 0, lainnya
Hasil Estimasi :
Variable Parameter Odd Ratio Variabel Label
B Sig.
Intercept -1, 9504 (0,000) -
Tempat Tinggal -0, 8517 (0,000) 0,4267 Tempat tinggal, 1 = Kota
Jenis Kelamin -0, 2046 (0,001) 0,8150 Jenis Kelamin, 1 = laki-
laki
Pendidikan 1 -0, 4750 (0,000) 0,6219 Tingkat Pend, 1 = T. SD
Pendidikan 2 -0,7259 (0,000) 0,4839 Tingkat Pend, 1 = T.
SLTP
Pendidikan 3 -0,8852 (0,000) 0,4126 Tingkat Pend. 1 = T. SMU
Status Pekerjaan -0,3852 (0,000) 0,6803 Status Pek. 1 = Formal
Lap. Pekerjaan 0,6200 (0,000) 1,8590 Lap. Pek. 1 = Pertanian
Lap. Pek 0,4247 (0,000) 1,5291 Lap. Pek. 1 = Industri


Analisa Hasil :
ln

= 1,9504 0,8517 TT 0,2046 JK 0,4750 PD1 0,7259 PD2 0,8852


PD3 0,3852 SP + 0,6200 LP1 + 0,4247 LP2
Persamaan menunjukkan bahwa nilai intersep sebesar -1,9504, artinya : ln (Pi/1-Pi ) =
-1,9504, pada saat semua variable berharga 0, yaitu pada saat responden bertempat tingga di
pedesaan, jenis kelamin kepala keluarga perempuan, pendidikan kepala keluara tidak tamat
SD, status pekerjaan kepala keluarga informal, dan lapangan pekerjaan kepala keluarga
dibidang jasa.
Dengan demikian, besaran



Atau
Besarnya probabilita : P =

= 0,1245
Probabilita bahwa anak suatu keluarga dengan karakteristik tersebut diatas akan
bekerja adalah sebesar 12,54%.
Slope untuk variable tempat tinggal mempunyai parameter sebesar -0,8517. Artinya
proporsi pekerja anak yang kepala keluarganya tinggal di perkotaan lebih kecil bila
dibandingkan dengan pekerja anak yang kepala keluarganya tinggal di daerah pedesaan. Hal
ini dapat dilihat dari data berikut :
ln

= - 0,8517 ; perband. Resiko sebesar:

= 0,4267
artinya, resiko responden yang kepala keluarganya tinggal di daerah perkotaan untuk
menjadi pekerja anak adalah sebesar 0,4267 kali bila dibandingakanndengan resiko
responden yang kepala keluarganya tinggal di pedesaan.
Contoh Kasus
Seorang peneliti ingin mengetahui bagaimana pengaruh kualitas pelayanan publik terhadap
kepuasan pengguna (masyarakat). Kualitas pelayanan publik diteliti melaluji variabel Daya
Tanggap (X1) dan Empati (X2). Kepuasan penggunana layanan (Y) sebagai variabel
dependent adalah variabel dummy dimana dimana jika responden menjawab puas maka kita
beri skor 1 dan jika menjawab tidak puas kita beri skor 0.

No
.
X1 X2 Y No
.
X1 X2 Y No
.
X1 X2 Y
1 36 45 1 18 34 42 1 35 34 40 1
2 34 39 0 19 33 40 0 36 30 38 0
3 30 38 0 20 34 43 0 37 30 40 1
4 32 38 1 21 32 39 0 38 35 41 1
5 36 45 1 22 36 44 1 39 34 42 1
6 33 42 0 23 33 37 0 40 33 40 0
7 36 45 1 24 30 38 0 41 34 43 0
8 36 45 1 25 36 43 1 42 30 38 0
9 31 36 0 26 33 41 0 43 34 42 1
10 31 37 0 27 32 39 0 44 30 41 1
11 36 45 1 28 30 36 0 45 34 40 0
12 33 41 0 29 30 36 0 46 34 42 1
13 32 40 0 30 36 42 1 47 34 38 0
14 33 39 0 31 33 38 0 48 34 44 1
15 34 42 1 32 33 38 0 49 35 43 0
16 34 42 0 33 35 41 1 50 34 42 1
17 32 39 0 34 35 41 1

Hasil Analisis dengan SPSS :


LOGISTIC REGRESSION VARIABLES Y
/METHOD=ENTER X1 X2
/CRITERIA=PIN(.05) POUT(.10) ITERATE(20) CUT(.5).

Logistic Regression

[DataSet0]

Case Processing Summary
Unweighted Cases
a
N Percent
Selected Cases Included in Analysis 50 33.3
Missing Cases 100 66.7
Total 150 100.0
Unselected Cases 0 .0
Total 150 100.0
a. If weight is in effect, see classification table for the total number of
cases.


Dependent Variable Encoding
Original Value Internal Value
Tidak Puas 0
Puas 1




Block 1: Method = Enter

Omnibus Tests of Model Coefficients

Chi-square df Sig.
Step 1 Step 21.395 2 .000
Block 21.395 2 .000
Model 21.395 2 .000


Model Summary
Step -2 Log likelihood
Cox & Snell R
Square
Nagelkerke R
Square
1 47.198
a
.348 .466
a. Estimation terminated at iteration number 5 because
parameter estimates changed by less than ,001.


Classification Table
a


Observed
Predicted

Kepuasan Pengguna
Percentage
Correct Tidak Puas Puas
Step 1 Kepuasan Pengguna Tidak Puas 22 6 78.6
Puas 4 18 81.8
Overall Percentage

80.0
a. The cut value is ,500



Variables in the Equation

B S.E. Wald df Sig. Exp(B)
Step 1
a
X1 .267 .302 .782 1 .376 1.306
X2 .552 .252 4.785 1 .029 1.737
Constant -31.776 9.150 12.062 1 .001 .000
a. Variable(s) entered on step 1: X1, X2.



Block 0: Beginning Block

Classification Table
a,b


Observed
Predicted

Kepuasan Pengguna
Percentage
Correct Tidak Puas Puas
Step 0 Kepuasan Pengguna Tidak Puas 28 0 100.0
Puas 22 0 .0
Overall Percentage

56.0
a. Constant is included in the model.

b. The cut value is ,500



Variables in the Equation

B S.E. Wald df Sig. Exp(B)
Step 0 Constant -.241 .285 .717 1 .397 .786


Variables not in the Equation

Score df Sig.
Step 0 Variables X1 13.536 1 .000
X2 17.460 1 .000
Overall Statistics 18.031 2 .000

Você também pode gostar