Você está na página 1de 49

ANALISIS DATA KATEGORIK

Disusun Oleh :
Kelompok 5
1. Dygta Hadinagara
2. Libertania Maria Melania Esti Un
3. Yohanes Paulus Dawe
4. Gabriela Hulu Tedemaking

IST AKPRIND YOGYAKARTA


JURUSAN STATISTIKA
FAKULTAS SAINS TERAPAN
Distribusi Multinomial

 Misalnya terdapat c kategori pada


variabel respon. Peluangnya dinotasikan
{1 ,2 ,…,c} di mana σ𝑐𝑗 𝑗 = 1.
 Untuk n sampel, peluang Multinomial
bahwa n1 jatuh pada kategori1, n2 jatuh
pada kategori 2,…, nc jatuh pada
kategori c di mana σ𝑗 𝑛𝑗 = 𝑛
Regresi Logistik Multinomial

Regresi Logistik yang melibatkan variabel


respon dengan kategori lebih dari dua
dengan skala nominal yaitu tidak memiliki
tingkatan serta variabel prediktor yang
bersifat kategori dan atau kontinyu
disebut sebagai regresi logistik
multinomial
Regresi Logistik Multinomial

Suatu variabel respon dengan M kategori


akan membentuk persamaan logit sebanyak
M-1 di mana masing-masing persamaan ini
membentuk regresi logistik biner yang
membandingkan suatu kelompok kategori
terhadap kategori pembanding
Model Multinomial Logit

Secara umum model multinomial logit


adalah
Jika yang digunakan sebagai pembanding
adalah kategori M, maka ξM = 0 untuk

di mana p adalah banyaknya variabel


prediktor, sehingga transformasi logitnya
menjadi,
Multinomial Logit dengan 3 Kategori
Respon

Dalam model regresi logistik dengan 3 kategori Y


(Y=0,1,2), dibutuhkan 2 fungsi logit dan harus
diputuskan kategori respon mana yang menjadi
kategori pembanding
Misal Y=0 sebagai kategori pembanding untuk
membentuk 2 logit (yaitu sebagai pembanding
untuk Y=1 dan Y=2) maka
Menurut Hosmer dan Lemeshow (2000)
untuk mendapatkan model, asumsikan
terdapat p variabel prediktor dan n
sampel yang dinotasikan sebagai vektor X
dengan matrik berukuran n x (p+1)di mana
X0=1. Dua fungsi logit dinotasikan sebagai:
Bentuk Umum fungsi peluang dengan
3 kategori respon
 Secara teori, model dengan 3 kategori peubah
respon akan menghasilkan dua fungsi logit.
 Sebenarnya dapat digunakan pasangan kategori
pembanding yang mana saja tergantung dari
tujuan yang ingin dicapai dalam penelitian, tetapi
menurut Hosmer dan Lemeshow (2000) lebih baik
menggunakan kategori 0 sebagai pembanding
karena merupakan perluasan dari model dengan
dua
 kategori variabel respon (biner).
Pendugaan Parameter

 Pendugaan parameter dari model logit


menggunakan metode maksimum likelihood
 Untuk membuat fungsi likelihood pada model
dengan kategori respon lebih dari 2
(misalnya 3 kategori) hal pertama yang
dilakukan adalah membuat 3 variabel biner
yang dikode 0 atau 1 untuk menandai group
membership (anggota kelompok) pada suatu
observasi
 Dalam kasus ini 3 variabel biner tersebut
hanya untuk menjelaskan fungsi likelihood
dan bukan digunakan untuk analisis
regresi logistik multinomial yang
sebenarnya
Pengujian Terhadap Pendugaan
Parameter
a. Pengujian pendugaan parameter () secara
parsial
Uji koefisien regresi secara parsial digunakan untuk
memeriksa peranan koefisien regresi dari masing-
masing variabel prediktor secara individu dalam
model. Hipotesis yang digunakan adalah:
Pengujian Terhadap Pendugaan
Parameter
Statistik uji yang digunakan adalah statistik uji Wald
yang dapat ditulis:
Pengujian Terhadap Pendugaan
Parameter
Pengujian Terhadap Pendugaan
Parameter
Pengujian Terhadap Pendugaan
Parameter
Pengujian Terhadap Pendugaan
Parameter
Interpretasi Koefisien regresi logistik
 Interpretasi dalam regresi logistik menggunakan
nilai odds ratio yang menunjukkan perbandingan
tingkat kecenderungan dari kategori yang ada
dalam satu variabel prediktor.
 Nilai odds ratio pada respon multinomial
menggunakan notasi umum yang digunakan dalam
respon biner.
 Misalnya Y=0 digunakan sebagai kategori
pembanding, odd ratio untuk Y=j terhadap Y=0
yang dihitung pada dua nilai 𝑥 = 𝑎 𝑑𝑎𝑛 𝑥 =
𝑏 adalah
 pada regresi logistik politomus dengan tiga
kategori respon akan terbentuk dua odds ratio.
 Yang pertama perbandingan peluang antara
respon kategori 1 (Y=1) dengan respon kategori
pembanding (Y=0)
 Yang kedua adalah perbandingan peluang antara
respon kategori 2 (Y=2) dengan respon kategori
pembanding (Y=0).
Koefisien Determinasi
Contoh
Sebanyak 200 pelajar dalam memilih program yang
akan dipilih pada saat masuk perguruan tinggi. Ada
3 program yang tersedia yaitu general program,
vocational program dan academic program. Adapun
variabel yang dianggap mempengaruhi pilihan para
pelajar dalam memilih program yang akan diambil di
perguruan tinggi diantaranya sosial economic status
(ses), tipe sekolah (schtyp) dan nilai hasi skor ujian
tettulis (write).
Variabel Response : Program di perguruan tinggi
Y= 1 (General), Y= 2 (Vocational), Y= 3 (Akademik).
Variabel Prediktor:
X1 = Sosial Economic Status (SES)
1 Jika Rendah, 2 Jika Sedang, 3 Jika Tinggi
X2 = Tipe Sekolah (SchTyp)
1Jika Public, 2 Jika Private
X3 = Jenis Kelamin (Gender)
0 Jika Pria, 1 Jika Perempuan
X4 = Nilai Skor Ujian Tertulis (Write)
Pengerjaan Menggunakan Software R
Model regresi logistik multinomial setelah dilakukan
transformasi adalah sebagai berikut:
 Model regresi logistik yang pertama

Y = 2 (Vocational) dengan pembanding Y=1


𝜋2
𝐿𝑜𝑔 = 𝛽20 + 𝛽21 𝑥1+……..+𝛽2𝑛 𝑥𝑛
𝜋1
= −2.869631 + 0.4205515 𝑋1 𝑆𝑒𝑑𝑎𝑛𝑔 + 1.0870955 𝑋1 𝑇𝑖𝑛𝑔𝑔𝑖
+ 0.481344 𝑋2 𝑃𝑟𝑖𝑣𝑎𝑡𝑒 − 0.07983894 𝑋3 𝑃𝑒𝑟𝑒𝑚𝑝𝑢𝑎𝑛 + 0.05877677 𝑋4
Model regresi logistik yang kedua adalah
Y =3(Akademik) dengan pembanding Y=1
𝜋3
𝐿𝑜𝑔 = 𝛽30 + 𝛽31 𝑥1+……..+𝛽3𝑛 𝑥𝑛
𝜋1
=2.330683 + 1.0367036𝑋1 𝑆𝑒𝑑𝑎𝑛𝑔 + 0.4244166𝑋1 𝑇𝑖𝑛𝑔𝑔𝑖 −
1.371649𝑋2 𝑃𝑟𝑖𝑣𝑎𝑡𝑒 + 0.53654819𝑋3 𝑃𝑒𝑟𝑒𝑚𝑝𝑢𝑎𝑛 − 0.06176521 𝑋4

Selanjutnya model Y=2 dan Y=3


𝜋3
𝐿𝑜𝑔 = (𝛽20 −𝛽30 ) + (𝛽2 −𝛽3 )𝑥 + ⋯ (𝛽2 −𝛽3 )𝑛
𝜋2
= −5.20031 − 0.6161 𝑋1 𝑆𝑒𝑑𝑎𝑛𝑔 + 0.6626 𝑋1 𝑇𝑖𝑛𝑔𝑔𝑖 + 1.8529 𝑋2 −
0.6163 𝑋3 + 0.1205 𝑋4
Mencari Model Terbaik
 MLM.2 dari Y~X1

FOKUS
 MLM.3 dari Y~X2

FOKUS
 MLM.4 dari Y~X3

FOKUS
 MLM.5 dari Y~X4

FOKUS
Setelah melakukan uji satu-satu variabel X terhadap Y
diperoleh masing-masing nilai deviance dari tiap-tiap
MLM. Selanjutnya melakukan pengurangan dari setiap
MLM uji satu-satu terhadap MLM uji keseluruhan

Dari hasil pengurangan,


diperoleh nilai terkecil yaitu
pada variabel X4, maka
variabel X4 adalah variabel
yang terpilih atau model yang
terbaik.
Selanjutnya melakukan uji MLM lagi bila
variabel X4 yang terbaik tadi
digabungkan dengan variabel X lainnya
terhadap variabel Y.
 MLM.6 dari Y~X4+X1

FOKUS
 MLM.7 dari Y~X4+X2

FOKUS
 MLM.8 dari Y~X4+X3

FOKUS
Setelah melakukan uji satu-satu variabel X4 + Variabel
X lainnya terhadap Y diperoleh masing-masing nilai
deviance dari tiap-tiap MLM. Selanjutnya melakukan
pengurangan dari setiap MLM uji satu-satu terhadap
MLM uji keseluruhan

Dari hasil pengurangan,


diperoleh nilai terkecil yaitu
pada MLM.6 variabel (X4 dan
X1), maka variabel X4 dan X1
adalah variabel yang terpilih
atau model yang terbaik.
Uji Signifikansi
 Hipotesis
H0 : Variabel Xi tidak berpengaruh signifikan terhadap variabel Y
H1 : Variabel Xi berpengaruh signifikan terhadap variabel Y
 Siginifikansi
α = 5%
 Statistik Uji
P – Value
 Daerah Kritis
H0 ditolak jika P-Value < α
 Kesimpulan
 Dari hasil output P-Value dapat disimpulkan bahwa SES Sedang, Tipe
Sekolah Private, dan Jenis Kelamin Perempuan tidak berpengaruh signifikan
terhadap pemilihan tipe sekolah Vocational sedangkan SES Tinggi dan Hasil
Ujian Tertulis berpengaruh secara signifikan terhadap pemilihan program
Vocational
 Dari hasil output P-Value dapat disimpulkan bahwa SES Tinggi, Tipe Sekolah
Private, dan Jenis Kelamin Perempuan tidak berpengaruh signifikan terhadap
pemilihan tipe sekolah Akademik sedangkan SES Sedang dan Hasil Ujian
Tertulis berpengaruh secara signifikan terhadap pemilihan program
Akademik
Odds Ratio
 Diperoleh nilai odds ratio SES sedang sebesar 1.522
artinya kecenderungan pelajar dengan SES sedang
memilih program Vocational di PT sebesar 1.522 atau
2 kali lebih besar dibandingkan pelajar dengan SES
sedang yang tidak memilih program Vocational di PT.
 Diperoleh nilai odds ratio SES sedang sebesar 2.965
artinya kecenderungan pelajar SES tinggi memilih
program Vocational di PT sebesar 2.965 atau 3 kali
lebih besar dibandingkan pelajar SES tinggi yang tidak
memilih program Vocational di PT.
 Diperoleh nilai odds ratio pelajar dengan Tipe sekolah
private sebesar 1.618 artinya kecenderungan pelajar
dengan tipe sekolah private memilih program
Vocational di PT sebesar 1.618 atau 2 kali lebih besar
dibandingkan pelajar dengan tipe sekolah private
yang tidak memilih program Vocational di PT.
 Diperoleh nilai odds ratio pelajar jenis kelamin
perempuan sebesar 0.923 artinya kecenderungan
pelajar jenis kelamin perempuan memilih program
Vocational di PT sebesar 0.923 atau 1 kali lebih besar
dibandingkan pelajar jenis kelamin perempuan yang
tidak memilih program Vocational di PT.
 Diperoleh nilai odds ratio pelajar yang memiliki
hasil ujian tulis sebesar 1.060 artinya
kecenderungan pelajar yang memiliki hasil ujian
tulis memilih program Vocational di PT sebesar
1.060 atau 1 kali lebih besar dibandingkan pelajar
dengan yang memiliki hasil ujian tulis yang tidak
memilih program Vocational di PT.
TERIMA KASIH

Você também pode gostar