Escolar Documentos
Profissional Documentos
Cultura Documentos
dan log
tidak tersedia. (Dapat diperiksa bahwa hal ini juga berlaku pada
metode Maximum Likelihood Estimator dari parameter model yang diuraikan
pada bagian teraChir bab ini.) Dalam hal bias dan mean-squre error, Gart dan
Zweifel (1967) dan Hadane (1956) menjelaskan bahwa penduga yang diperbaiki
adalah sbb.
11 22
12 21
( 0.5)( 0.5)
( 0.5)( 0.5)
n n
n n
+ +
+ +
%
Dan log
%
akan berlaku dengan baik (sebagaimana pada soal 14.4)
Penduga
dan
%
memiliki distribusi normal yang asimptotik di sekitar .
Kecuali jika n cukup besar, bagaimanapun juga, distribusinya akan cenderung
untuk menceng. Untuk kasus dimana =1 misalnya, karena
0 maka nilai
tidak bisa melebihi , namun dapat bernilai lebih besar pada peluang yang tidak
memenuhi syarat. Transformasi dengan log, lebih memiliki struktur
penjumlahan dibandingkan dengan perkalian, dan konvergen lebih cepat kepada
distribusi normal. Standar error dugaan untuk log
adalah
1/ 2
11 12 21 22
1 1 1 1
(log )
n n n n
_
+ + +
,
Yang diturunkan dari formula 3.1.7.
Normalitas untuk sampel besar dari log
akan memenuhi
/ 2
log (log ) z
t
Merupakan selang kepercayaan Wald untuk log . Mengubah kedalam
bentuk eksponensial (antilog) dari titik akhir memerlukan selang kepercayaan
untuk . Selang ini disarankan oleh Woolf (1995) dan biasanya cukup berhasil ,
terlepas dari sifatnya yang konservatif (sebagai contoh: cakupan peluang
sebenarnya lebih tinggi daripada nilai secara nominal.)
Ketika
= 0, kita perlu
mengambil nilai 0 sebagai batas bawah, dan ketika
= , nilai digunakan
sebagai batas atas. Untuk batasan lainnya dapat digunakan formula Woolf
dengan sed ikit penyesuaian, seperti dilakukan oleh Gart (1966), dengan
mengganti {n
ij
} menjadi {n
ij
+ 0.5} pada penduga dan standar error. Sebuah
pendekatan yang lebih sementara membentuk selang dengan mengubah nilai uji
(Cornfield 1956) atau uji rasio Likelihood untuk (sebagaimana dibahas pada
3.1.8).
3.1.2. Contoh Pada Aspirin dan Myocardial Infarction
Myocardial Infarction
Total
Yes No
Placebo 28 656 684
Aspirin 18 658 676
Dengan odds rasio
1.56
mendekati
1.55
%
, maka selang kepercayaan untuk
log adalah0, 445 1, 96(0, 307) t atau (-0,157; 1,047). Interval penghubung untuk
adalah [exp(-0,157),exp(1,047) atau (0,85;2,85). Estimasi sebenarnya untuk
odds ratio cukup tidak tepat.
Ketika selang kepeercayaan mengandung nilai 1,0 maka masuk akal bahwa odds
sebenarnya untuk kematian myocardial infarction sama untuk aspirin dan
placebo. Jika sebenarnya terdapat manfaat efek aspirin namun odds ratio tidak
akan terlalu besar, mungkin akan ditunjukkan manfaat sebab hubungan untuk
kasus myocardial infarction dalam jumlah kecil.
3.1.3. Pendugaan Selang Pada Selisish Proporsi
Selisih proporsi dan resiko relatif membandingkan distribusi bersyarat dari
sebuah variabel respon untuk dua kelompok. Untuk pengukuran ini, kita
memperlakukan sampel sebagai binomial independen. Pada kelompok ke-i, y
i
memiliki distribusi binomial dengan jumlah sampel n
i
dan peluang sukses respon
sebesar
i
.
Proporsi sampel
/
i i i
y n memiliki nilai harapan
i
dan varians
(1 ) /
i i i
n . Karena
1
dan
2
independen, maka keduanya memiliki selisih
sebesar
1 2 1 2
( ) E
Dan standar error
( )
1/ 2
1 1 2 2
1 2
1 2
(1 ) (1 )
n n
1
+
1
]
Penduga ( )
1 2
menggunakan formula (3.3) dengan
i
digantikan oleh
i
,
maka
( ) ( )
1 2 / 2 1 2
z
t
Merupakan selang kepercayaan wald untuk
1 2
. Sebagaimana selang Wald
(1.13) untuk proporsi tunggal, yang biasanya memiliki peluang cakupan
sebenarnya kurang dari nilai koefisien kepercayaan, terutama ketika
1
dan
2
mendekati 0 atau 1.
3.1.4. Selang Pendugaan pada Resiko Relatif
Resiko relatif sampel adalah
1 2
/ r yang sebagaimana halnya odds rasio,
kovergen dengan sangat cepat ke bentuk normal pada skala logaritma. Standart
error asimptotik untuk log r adalah
1/ 2
1 2
1 1 2 2
1 1
(log ) r
n n
_
+
,
Selang wald mengeksponensialkan
/ 2
log (log ) r z r
adalah
parameter Binomial untuk
dan
( ) (1 ) / Var n
. Selain itu,
yaitu
( ) log[ / (1 )] g
disebut logit sampel.
Evaluasi
1
_
1
1
,
]
Normalitas asimtotik
Menyebar secara asimtotik normal pada
log[ / (1 )]
Varians asimtotik adalah varian distribusi normal yang kurang lebih merupakan
distribusi sebenarnya untuk sampel n yang besar. Untuk
0 1 < <
,varians
asimtotik
1
[ (1 )] n
i
dan
memiliki
kovariansi
cov( , ) /
i j i j
n
Proporsi sampel ( )
1 2 1
, ,...,
c
memiliki distribusi normal multivariate dengan
sampel besar. Untuk set fungsi tersebut, metode delta memberikan hasil berikut,
yang dibuktikan pada bagian 14.1.4.
Jika ( ) g merupakan funsi turunan dari
i
dengan nilai sampel
( ) g untuk sampel
multinomial, maka
( )
i
i
g
, i=1,,c
Maka ketika
n
distribusi [ ]
( ) ( ) / n g g konvergen ke distribusi normal
standar dimana
( )
2
2 2
i i i i
Varians asimptotik tergantung kepada { }
i
dan turunan parsial dari ukuran
dengan memperhatikan { }
i
. Pada prakteknya, menggantikan { }
i
dan { }
i
pada
(3.9) dengan nilai sampelnya akan menghasilkan estimasi Maximum Likelihood
untuk
2
dan
2
. Selanjutnya
2
/ n
merupakan standar error dugaan untuk
( ) g . Selang Kepercayaan Wald untuk ( ) g adalah
/ 2
( ) / g z n
t
Dengan mengganti untuk
, dan /
akan konvergen secara peluang ke 1. Sekarang
( ) ( ) ( ) ( )
g g g g
n n
12 21 22
12 21 22
1 1 1
; ;
0
ij ij
i j
dan ( )
2 2
1/
ij
ij ij
i j i j
. Maka standar error
asimptotik dari log
(log ) / 1/
ij
i j
n n
Karena
ij ij
n n
maka standar error dugaan adalah (3.1)
Metode delta juga dapat diterapkan secara langsung dengan untuk
mendapatkan
1/
dan standar errornya.
3.1.8. Angka dan Profil Likelihood untuk selang Kepercayaan
Standar error yang didapatkan dengan metode delta muncul pada selang
interval Wald. Namun, selang yang dihasilkan tersebut kadang kala kurang baik
jika diterapkan pada jumlah sampel yang kecil hingga menengah. Selang
alternative lainnya dihasilkan dengan mencari kebalikan dari rasio likelihood
pada skor hasil tes. Meskipun memerlukan perhitungan yang lebih rumit, namun
metode ini seringkali bekerja lebih baik.
Pertama kita gambarkan metode skor untuk selisih proporsi, dimana skor
tes memiliki statistik uji
0 1 2
: H (Mee 1984; Miettinen dan Nurminen 1985)
( )
[ ] [ ]
1 2
1 1 1 2 2 2
( )
{ ( ) 1 ( ) / } { ( ) 1 ( ) / }
z
n n
+
Dimana
1
( ) menyatakan penduga Maximum Likelihood dari subjek
1
terhadap batasan
1 2
. Yaitu
1
( ) dan
2
( ) merupakan nilai dari
1
dan
2
yang memenuhi
1 2
dan memaksimalkan hasil dari dua fungsi massa
peluang binomial. Nilai ini tidak memiliki bentuk yang closed form dan
ditentukan menggunakan metode numeric. Skor selang kepercayaan merupakan
set dari sedmikian hingga
/ 2
| ( ) | z z
2 ( , ( ), ( )) ( , , ) ( ) L L
+ + + +
1
<
]
Persamaan terbut mengandung seluruh
0
yang tidak ditolak di dalam uji rasio
likelihood dengan ukuran nominal .
Pendekatan terkait dapat menggunakan fungsi likelihood bersyarat yang
mengeliminasi parameter gangguan dengan memberikan syarat pada statistik
cukupnya. Hal ini sangat menguntungkan ketika terdapat banyak parameter
gangguan. Berbeda dengan Wald, keuntungan dari penggunaan skor dan selang
yang berdasarkan likelihood adalah mereka tidak terpengaruh secara
berlawanan ketika resiko relatif sampel atau odds rasio adalah 0 atau .
3.2. Uji Kebebasan Pada Tabel Kontingensi Dua Arah
Untuk sampling multinomial dengan peluang { }
ij
dalam sebuah tabel
kontingensi I x J, hipotesis null untuk kebeasan statistik adalah
0
:
ij i j
H
+ +
ditempatkan pada
i
. Di sini
( )
ij ij
E n
berada di dalam H
0
. Biasanya nilai { }
i
+
dan { }
j
+
tidak diketahui. Penduga ML-
nya merupakan proporsi sampel marginal
1 1
/ n n
+ +
dan
1 1
/ n n
+ +
, jadi
dilakukan estimasi frekuensi harapan adalah { }
/
ij i j i j
n n n n
+ + + +
maka nilai
2
akan setara dengan
( )
2
2
ij ij
i j
ij
n
Pearson (1900, 1904, 1922) menyatakan bahwa mengganti { }
ij
dengan { }
ij
ij
memerlukan perkiraan nilai
{ }
i
+
dan { }
j
+
maka berdasarkan bagian 1.5.6.
( 1) ( 1) ( 1) ( 1)( 1) df IJ I J I J
Dimensi dari nilai { }
i
+
dan { }
j
+
merefleksikan batasan
1
i j
i j
+ +
. R. A.
Fisher (1922) memperbaiki error yang diberikan oleh Pearson (Bagian 16.2).
Dalam Artikelnya dia memperkenalkan notasi dari derajat kebebasan.
Skor uji menghasilkan statistik
2
, sementara uji rasio likelihood
menghasilkan hal yang berbeda. Pada sampling multinomial, bakal dari
likelihood adalah.
ij
n
ij
i j
,dimana seluruh
0
ij
dan
1
ij
i j
+
dan { }
j
+
, maka dimensinya adalah (I-1)+(J-1).
Selisih pada dimensi ini setara dengan (I-1)(J-1). Untuk jumlah sampel yang
besar nilai
2
G
dan
2
memiliki batasan distribusi Chi-kuadrat yang sama.
Faktanya keduanya kemudian setara secara asimptotik;
2
-
2
G
konvergen dalam
peluang ke nol (bagian 14.3.4). Hasil pembatasan untuk sampling multinomial
juga dapat diterapkan dengan susunan sampling lainnya (Roy dan Mitra, 1956;
Watson, 1959).
Hasil perhitungan tersebut jika diterapkan ketika jumlah n meningkat,
sehingga menyebabkan { }
ij ij
n meningkat, untuk jumlah kolom yang tetap.
Ketika jumlahnya meningkat, distribusi multinomial untuk { }
ij
n lebih baik
diperkirakan dengan distribusi normal multivariat, dimana
2
G
dan
2
ternyata
lebih dekat kepada distribusi Chi-kuadrat. Kekonvergenan
2
terhadap distribusi
Chi kuadrat lebih cepat dibandingkan dengan
2
G
. Perhitungan dengan
menggunakan
2
G
memberikan hasil yang lebih buruk ketika n/IJ <5. Ketika
besaran I atau J besar, maka hasil
2
cukup memuaskan ketika sebagian
frekuenasi yang diharapkan lebih kecil dari 1 namun lebih banyak melampaui 5.
Metode sampel kecil (bagian 3.5) tersedia kapanpun terdapat keraguan apakah
jumlah n cukup besar atau tidak.
3.3. Uji Chi-Kuadrat Ikutan
Sebagaimana uji signifikansi sebagaimana umumnya, uji kebebasan Chi-
kuadrat memiliki kegunaan yang terbatas. Nilai peluang yang kecil
mengindikasikan bahwa terdapat bukti yang cukup terhadap adanya hubungan,
namun menyediakan informasi yang sedikit tentang kekuatan atau bentuk
hubungan tersebut. Para statistisi telah lama mewaspadai untuk tidak
bergantung sepenuhnya terhadap hasil uji Chi kuadrat dibandingkan dengan
mempelajari sifat dari hubungan tersebut (Berkson, 1938; Cochran, 1954). Pada
bagian ini akan didiskusikan lanjutan cara untuk uji tentang hubungan.
3.3.1. Residual Pearson dan Residual yang Distandarkan
Perbandingan antar kolom yang diamati atau perkiraan frekuensi harapan
memberikan pertolongan untuk memperlihatkan sifat dari ketergantungan.
Dibawah H
0
, selisih yang semakin besar antara
( )
ij ij
n
sering terjadi dalam
kolom dengan
ij
ij ij
ij
ij
n
e
Percobaan untuk menyesuaikan hal ini. Residual Pearson terkait dengan Statistik
Pearson
2 2
ij
i j
e
.
Dibawah H
0
, { }
ij
e adalah normal asimptotik dengan mean 0.
Bagaimanapun, pada 14.3.2 telah ditunjukkan bahwa varians asimptotiknya
adalah kurang dari 1.0, yang merupakan rata-rata [(I-1)(J-1)]/(jumlah kolom).
Dengan memperbandingkan residual Pearson terhadap nilai persentase standar
normal memberikan indikator konservatif bahwa kolom memiliki tingkat
kesesuaian yang kurang.
Residual Pearson yang distandarkan adalah asimptotik terhadap hasil
normal standar yang dihasilkan dari membaginya dengan standar error
(haberman, 1973a dan bagian 14.3.2). Untuk H
0
: tidak terikat/bebas, maka
1/ 2
(1 )(1 )
ij ij
ij i j
n
p p
+ +
1
]
Jika nilai residual Pearson yang distandarkan bernilai lebih dari 2 atau 3 dalam
nilai mutlak, maka hal ini mengindikasikan terjadinya kekurangsuaian H
0
dalam
kolom tersebut. Nilai yang lebih besar akan lebih sesuai jika derajat bebas besar
sehingga terlihat jelas bahwa salah satunya memiliki kesempatan yang cukup
besar.
3.3.2. Pendidikan dan Perbaikan Fundamental Agama
Tabel 3.2 Pendidikan dan Kepercayaan Agama
Tingkat
Tertinggi
Kepercayaan Agama Total
Fundamenta
lis
Moderat Liberal
< SMA 178 138 108 424
(137,8)
1
(161,5) (124,7)
(4,5)
2
(-2,6) (-1,9)
SMA atau
Junior
College
570 648 442 1660
(539,5) (632,1) (488,4)
(2,6) (1,3) (-4,0)
Sarjana 138 252 252 642
atau
pascasarjan
a
(208,7) (244,5) (188,9)
(-6,8) (0,7) (6,3)
Total 886 1038 802 2726
Tabel diatas menunjukan residual standar Pearson untuk uji kebebasan.
Misalnya n
11
= 178 dan
11
aj
a i
n
<
aj
a i
n
<
ij
n
Dengan i=2,..,I dan j=2,,J. Untuk lainnya dapat dilihat pada Giulia dan
Haberman (1998) dan Goodman (1969a, 1971b).
3.3.4. Contoh: Asal dari Schizopherenia
Tabel 3.3 mengklasifikasikan sampel psychiatrist dengan gagasan psychiatrist
sekolah mereka dan opini mereka pada asal Schizopherenia. Dimana G
2
=23,04
dengan df=4. Untuk lebih memahami hubungan ini, kita partisi G
2
kedalam
empat komponen saling bebas. Ditampilkan dalam tabel 3.4. Untuk subtabel
awal perbandingan pandangan eclectic dan medical school pada asal
schizophrenia adalah biogenic atau environmental yang diklasifikasikan dalam 2
kategori. Pada subtabel ini G
2
= 0,29 dengan df = 1. Pada Subtabel kedua
perbandingan dua sekolah dengan menganggap bahwa proporsi berasal dari
kombinasi waktu asal , lebih dari biogenic atau environmental. Subtabel ini
G
2
=1,36.
Tabel 3.3 Pengaruh Pandangan Sekolah Psychiatric dan Menganggap
berasal Schizophrenia
Pandangan
Sekolah
Psychiatric
Asal Schizophrnia
Biogenic Environmental Combiantion
Eclectic 90 12 78
Medical 13 1 6
Psychoanalytic 19 13 50
Tabel 3.4 Kegunaan Subtabel Dalam Partisi Chi-Squared untuk table 3.3
Bio En
v
Bio+E
nv
Co
m
Bio En
v
Bio+E
nv
Co
m
Ecl 90 12 Ecl 102 78 Ecl+M
ed
10
3
13 Ecl+M
ed
116 84
Me
d
13 1 Me
d
14 6 Psy 19 13 Psy 32 50
Dengan df =1. Penjumlahan dua komponen persamaan G
2
untuk uji kebebasan
dengan dua baris awal pada tabel 3.3. Memberikan bukti kecil perbedaan antara
pandangan eclectic dan school medical pada anggapan asal schizophrenia.
Kemudian kita kombinasikan eclectic dan medical school dan membandingkan
mereka pada psychoanalytic school. Pada subtabel ketiga pada tabel 3.4
membandingkan mereka pada klasifikasi (biogenic,environmental), memberikan
G
2
=12,95 dengan df=1. Keempat subtabel membandingkan mereka untuk
(biogenetic atau environmental, kombinasi) dipisahkan, memberikan G
2
=8,43
dengan df=1.
3.3.5. Aturan Partisi
Goodman (1969a, 1971b) dan Lancaster (1949, 1969) memberikan aturan
untuk menentukan jumlah komponen bebas dari chi kuadrat.
1. Jumlah derajat bebas dari sub tabel harus sama dengan jumlah derajat
bebas secara keseluruhan
2. Setiap kolom dalam sub tabel harus dihitung hanya sekali, dan setiap sub
tabel juga dihitung hanya sekali
3. Masing masing jumlah marginal dari tabel secara lengkap harus
merupakan marginal dari hanya salah satu sub tabel.
Untuk jumlah partisi yang pasti, ketika jumlah derajat bebas sub tabel
dapat dijumlahkan seperlunya sementara
2
G
tidak, maka masing-masing
komponen tidak independen.
Pada setiap statistik
2
G
, terdapat jumlah partisi yang pasti. Statistik
2
+
dan
{ }
j
+
dibandingkan dengan { }
ij
). Akibatnya, MSE akan lebih kecil, kecuali n
sangat besar sehingga bentuk bias mendominasi varians.
Dari tabel 3.5. dapat diilustrasikan bahwa [ ]
1 ( 2)( 2)
ij i j
i j
+ +
+ untuk
i
+
=
j
+
= 1/3. Disini -1 < < 1, dengan =0 menyatakan bahwa model adalah
bebas. Kebebasan dapat memperkirakan hubungan dengan baik ketika
mendekati 0. Dengan demikian, total nilai MSE untuk kedua penduga adalah
MSE ({ }
ij
p ) =
2
( ) ( )
ij ij ij
i j i j
E p Var p
2
(1 ) / 1 /
ij ij ij
i j i j
n n
_
,
MSE ({ }
ij
) =
2
( )
ij ij
i j
E
' ;
MSE({
ij
})=
2
2 3
1 4 4 4 2 2 2
1
9 9 81 n n n n n
+ + +
' ; ' ;
3.4 Tabel Dua Arah Dengan Klasifikasi Ordinal
Tes uji chi-square X
2
dan G
2
mengabaikan beberapa informasi ketika
digunakan untuk menguji independensi antar klasifikasi yang berupa ordinal.
Oleh karena itu diperlukan statistik uji lainnya yang lebih baik untuk
melakukan uji independensi antar klasifikasi ordinal.
3.4.1 Alternatif trend linear untuk uji independensi
Analisis yang lebih populer saat ini menggunakan metode skor untuk
mengkategorikan dan meringkas trend linear.
Uji statistik yang bisa menangkap adanya trend linear adalah uji korelasi
Semakin besar nilai korelasi absolut, maka data semakin tidak
independen.
Rumus yang digunakan adalah:
2 2 2
( 1) M n r
Nilai M
2
akan meningkat seiring dengan meningkatnya nilai r dan n.
Semakin besar nilai M
2
, semakin kecil nilai p-value, maka semakin
menunjukkan ketidakindependennya.
Namun tidak selalu jika M
2
besar berarti hubungan antar klasifikasi
tersebut adalah linear. Nilai M
2
hanya menunjukkan ada atau
tidaknya independensi antar klasifikasi.
3.4.2 Contoh perbandingan antara penggunaan Tes uji chi-square X
2
dan G
2
dengan M
2
Tabel 2.8 Tabulasi silang antara Kepuasan Kerja dengan Pendapatan
Pendapatan
(dalam
Dollar)
Kepuasan Kerja
Sangat Tidak
Puas
Sedikit Puas Cukup Puas Sangat Puas
< 15.000 1 3 10 6
15.000
25.000
2 3 10 7
25.000
40.000
1 6 14 12
> 40.000 0 1 9 11
Sumber: General Social Survey, National Opinion Research Center, 1996.
Dari tabel di atas dapat dihitung nilai uji chi-square X
2
=6,0 dan G
2
=6,8
dengan df=9 (nilai p-value nya = 0,74 dan 0,66). Dari nilai p-value
tersebut ternyata gagal tolak H
0
, artinya bahwa tidak ada hubungan
antara kepuasan kerja dengan tingkat pendapatan.
Namun apabila menggunakan score (1,2,3 dan 4) untuk kepuasan kerja
dan (7,5; 20; 32,5; dan 6,0) untuk tingkat pendapatan, ternyata diperoleh
nilai korelasi r=0,2 dan uji statistik M
2
=(96-1)(0,2)
2
=3,81 serta p-
value=0,51. Dengan uji 1 arah (trend positif), dengan menggunakan M=
=1,95 dan p-value = 0,026 ternyata berhasil menolak H
0
. Jadi uji
M
2
lebih kuat dari pada chi-square.
3.4.3 Alternatif trend Monoton untuk uji independensi
Selain trend linear yang membutuhkan skoring, alternatif lainnya yang
lebih fleksibel adalah dengan menggunakan gamma.
Untuk sampel besar, gamma konvergen ke distribusi normal.
Uji statistik . Dari tabel 2.8 didapat nilai = 0,221, SE=0,117
(dengan perhitungan software SAS), sehingga diperoleh nilai
z=0,221/0,117 = 1,89 (p-value=0,03). Dengan tingkat keyakinan 95% nilai
terletak pada 0,221 1,96(0,117) atau (-0,01 s.d 0,45). Jadi hubungan
sebenarnya antara kepuasan kerja dengan tingkat pendapatan adalah
positif yang moderat.
3.4.4 Extra Power untuk uji independensi data ordinal
Uji X
2
dan G
2
adalah uji yang paling umum untuk pengujian independensi
antar variabel.
Namun untuk uji independensi data yang berskala ordinal dan
menunjukkan adanya trend, maka statistik uji M
2
atau z (fungsi gamma)
lebih kuat dari X
2
dan G
2
.
3.4.5 Pemilihan skor
Ada beberapa cara penentuan skor, namun yang ideal adalah bahwa skala
skor dipilih dari konsensus (kesepakatan) para ahli, sehingga
interpretasinya tidak mengalami distorsi.
Perbedaan sistem skor akan menghasilkan perbedaan interpretasi.
Salah satu metode yang disepakati oleh para ahli adalah metode
Spearmans rho. Metode ini digunakan ketika variabel yang diuji (X dan Y)
adalah variabel ordinal dan M
2
menggunakan midrank scores.
Berikut adalah contoh bahwa perbedaan skor akan mempengaruhi hasil
interpretasi
Contoh: Tabel 3.7 Hubungan antara Konsumsi dengan Malformation
Malformation
Konsumsi Alkohol (Rata-rata Frekuensi Minum per
hari)
0 < 1 1 -2 3 5 6
Absent 17.066 14.464 788 126 37
Present 48 38 5 1 1
Jumlah 17.114 14.502 793 127 38
Sumber: Graubard and Korn, 1987)
Apabila menggunakan skor sembarang untuk konsumsi alkohol (0; 0,5;
1,5; 4; 7), maka nilai M
2
=6,57 dan p-value=0,01. Dengan demikian maka
H
0
ditolak (terdapat hubungan antara konsumsi alkohol dengan
malformation).
Apabila menggunakan skor bertingkat (1, 2, 3, 4, 5), maka nilai M
2
=1,83
dan p-value=0,18, Dengan demikian maka gagal tolak H
0
(tidak terdapat
hubungan antara konsumsi alkohol dengan malformation).
Apabila menggunakan skor midrank (8557,5; 24.365,5; 32.013; 32.473
dan 32.555,5), maka nilai M
2
=0,35 dan p-value=0,55. Dengan demikian
maka gagal tolak H
0
.
3.4.6 Uji Trend untuk I x 2 dan 2 x J
Dengan midrank skor untuk Y, uji M
2
untuk tabel 2 x J cukup sensitif untuk
perbedaan di dalam mean rank untuk dua baris. Uji ini dikenal dengan
Wilcoxon atau Mann-Whitney test.
Ketika Y mempunyai 2 tingkatan pada tabel I x 2, trend linear dalam
statistik kemudian kembali ke trend linear dalam peluang kategori
respons. Uji ini dikenal dengan Uji Trend Cochran-Armitage (dibahas pada
bab 5.3.5).
3.4.7 Tabel Nominal dan Ordinal
Pengujian dengan teknik korelasi (M
2
) atau gamma () adalah tepat apabila
kedua klasifikasi data adalah ordinal. Namun ketika ada gabungan nominal dan
ordinal, maka diperlukan statistik uji lain. Salah satunya adalah dengan cara
merangkum tingkat variasi di antara rata-rata variabel ordinal pada kategori
yang berbeda-beda dari variabel nominal. Ini akan didiskusikan pada bagian
7.5.3.
3.5 Uji Independensi dengan Sampel Kecil
Ketika n kecil, maka metode alternatif yang digunakan adalah exact small-
sample distribution, bukan large-sample approximations.
3.5.1Uji Fishers exact untuk tabel 2 x 2
Sebuah fungsi distribusi tidak tergantung pada parameter yang tidak
diketahui dari pengkondisian total marginal pada tabel kontingensi.
Parameter-parameter itu biasanya bukan fix variabel.
Contohnya pada distribusi Poisson tidak mempunyai parameter yang fix.
Pada distribusi multinomial hanya n yang fix. Dan pada distribusi binomial
untuk tabel 2 x 2, hanya total marginal baris yang fix.
Uji Fishers exact menggunakan distribusi hypergeometric sebagai berikut:
Rumus tersebut adalah distribusi dari . terlatak antara
dimana dan
Untuk tabel 2x2, Independensi terjadi ketika odds ratio =1. H
0
: =1. P-
value adalah penjumlahan distribusi hypergeometric , t
0
adalah
notasi untuk nilai n
11
yang diobservasi.
3.5.2Fishers Tea Drinker
Berikut diberikan contoh penggunaan rumus Fisher.
Tabel 3.8 Percobaan Fishers Tea Tasting
Poured First
Guess Poured First
Total
Milk Tea
Milk 3 1 4
Tea 1 3 4
Total 4 4
Sumber: Berdasarkan Percobaan oleh Fisher, 1935.
Percobaan dilakukan oleh A. Fisher dengan koleganya Dr.Muriel Bristol.
Koleganya diminta untuk membedakan mana di antara 4 cangkir
minuman yang ditambahkan susu atau teh terlebih dahulu.
Misal t
0
= 3 adalah tebakan kolega Fisher yang sesuai, maka probability
ditambahkannya susu terlebih dahulu dalam cangkir minuman adalah:
Dengan cara sama diperoleh probabilitas n
11
=4 adalah 0,014, sehingga
nilai P-value , maka gagal tolak H
0
, artinya tidak ada
hubungan antara prediksi Dr.Bristol dengan kondisi sesungguhnya.
3.5.3P-Value dua arah untuk Uji Fishers Exact
Untuk uji satu arah, nilai p-value yang sama dapat dihasilkan dari tabel
ordinal tergantung dari besarnya n
11
, besarnya odds ratio atau besarnya
perbedaan proporsi.
Untuk uji 2 arah, perbedaan kriteria memberikan perbedaan p-value.
Untuk uji 2 arah, ada 4 pendekatan yang digunakan yaitu:
Pertama, Penjumlahan untuk menghitung t sebagaimana
dengan P-value nya adalah untuk nilai
observasi t
0
.
Yang kedua, menggunakan rumus:
,
Dimana hypergeometrik . Bentuk ini identik dengan
untuk statistik Pearson yang diobservasi.
Yang ketiga, menggunakan , tetapi nilai ini
bisa lebih dari 1.
Yang keempat, menggunakan ditambah
probablitas yang dihasilkan di bagian ekor lain yang paling dekat tetapi
tidak melebihi probabilitas ekor tersebut.
Pada praktiknya, uji 2 arah lebih umum digunakan daripada uji 1 arah.
Salah satu alasannya adalah adanya konsistensi dari tingkat kepercayaan
2 arah untuk mengestimasi ukuran yang memungkinkan untuk
membedakan antara 2 perlakuan.
3.5.4Tentang suatu fenomena Diskret dan isu konservatif
Distribusi Hypergeometrik adalah distribusi diskret untuk sampel kecil.
Pada umumnya distribusi diskret tidak dapa menerima level signifikan
yang fix, seperti 0,05. Hal ini menimbulkan stigma bahwa cara tersebut
adalah konservatif (kuno).
Cara lain untuk dapat menggunakan level signikan yang fix (0,05) adalah
dengan rumus:
Atau dengan mid-P-value dengan rumus mid-P-value = (1/2)P(n
11
=3) +
P(n
11
>3).
3.5.5Uji non-kondisional sampel kecil untuk independensi
Asumsi sampling secara umum untuk analisis perbandingan antara 2 grup
pada binary respons adalah bahwa baris2 merupakan sampel binomial
yang independen. Untuk distribusi poisson dan multinomial, tidak ada
distribusi marginal yang fix.
Uji non-kondisional sampel kecil untuk independensi adalah:
Untuk nilai
1
=
2
, probabilitas pada tabel 1 adalah
, supremum terjadi pada saat =1/2.
Sehingga P-value = 2(0,5)
3
(0,5)
3
=0,031
3.5.6Uji kondisional versus uji non-kondisional
Untuk statistik inferensia dengan nilai tidak nol (seperti interval
kepercayaan), Uji kondisional diterapkan hanya dengan odds ratio, tidak
dengan yang lain.
Uji non kondisional lebih powerful dibanding uji kondisional (seperti Uji
Fishers exact). Hanya saja secara komputasi, uji non-kondisional lebih
rumit dan kompleks.
Akan tetapi jika marginal total secara alami berupa fixed variabel, maka
Uji Fishers exact adalah yang terbaik. Meski dikategorikan konservatif,
namun dengan menggunakan mid-P-value akan bisa mengurangi efek
konservatif dari data diskret tersebut.
3.5.7Penurunan Distribusi Kondisional Exact
Diasumsikan antar baris dalam tabel IxJ mempunyai distribusi multinomial
yang independen. Total baris adalah fixed. I diestimasi sebagai
distribusi kondisional .
Formula Hipotesis H
0
: (indpenden).
Fungsi Probabilitas multinomial dirumuskan:
Distribusi tergantung pada .
Kontribusi pada pembentukan distribusi multinomial sebagaimana
rumus di atas tergantung pada data .
Data juga berdistribusi multinomial (n, {
+j
}) dengan formula:
Rumus pertama dibagi dengan rumus kedua akan menghasilkan distribusi
multihypergeometrik dengan rumus sebagai berikut:
3.5.8Uji Independen Exact untuk Tabel IxJ
Diberikan contoh tabel 3.9 tabulasi silang antara tingkat merokok dengan
Myocardial infarction sebagai berikut:
Tingkatan Merokok (batang rokok per hari)
0 1 - 24 > 25
Control 25 25 12
Myocardial
Infarction
0 1 3
Apabila menggunakan statistik uji X
2
(yang mengabaikan kategorisasi data
ordinal) diperoleh nilai exact , jadi gagal
tolak H
0
, artinya tidak ada hubungan antara banyaknya merokok dengan
myocardial infarction.
Dengan uji kondisional, perhitungan marginal untuk baris 1 (25, 26, 11)
dan untuk baris 2 (0, 0, 4) akan diperoleh probabilita (sesuai rumus
multiple hypergeometrik) adalah 0,018, jadi H
0
ditolak, artinya ada
hubungan antara banyaknya merokok dengan myocardial infarction.
3.6 Interval Kepercayaan dengan Sampel Kecil untuk Tabel 2x2
3.6.1 Inferensia Sampel kecil untuk Odds Ratio
Untuk distribusi multinomial tergantung pada n dan . Odds ratio
untuk tabel 2x2 adalah:
adalah fungsi dari dan Dan berdistribusi multinomial dengan
parameter
Karena n
11
adalah marginal total, maka distribusi kondisional noncentral
hypergeometrik dengan rumus sebagai berikut:
Untuk n
11
=t
0
, H
0
: =
0
, dan H
a
:
0
, nilai P-value adalah
Sedangkan untuk H
a
:
0
, nilai P-value adalah
Jika
0
=1, maka akan menjadi uji 1 arah Fishers exact.
Estimasi parameter adalah dengan Conditional Maximum Likelihood.
3.6.2 Sampel Tea Tasting
Dari tabel 3.8 dengan Conditional ML, diperoleh nilai estimasi sebesar
6,4. Dengan tingkat kepercayaan 0,95 diperoleh nilai interval (0,2;
626,2)
Dengan uji 2 arah diperoleh interval yang lebih kecil yaitu (0,3; 306,2).
3.6.3 Dampak data diskret terhadap Inteval kepercayaan.
Untuk sampel kecil, uji independensi dan penentuan interval kepercayaan
menggunakan probability exact (with conditional distribution). Oleh
karenanya dikatakan sebagai pendekatan konservatif (sebab pengaruh
data diskret).
Untuk sampel besar, bisa dipilih antara pendekatan konservatif atau
liberal. Sebagai contoh, untuk data pada tabel 3.8, nilai P-value chi-square
= 0,157 (gagal tolak H
0
) dibandingkan dengan uji exact 2 arah dengan p-
value 0,486 (tolak H
0
). Dengan tingkat kepercayaan 95% pada sampel
besar, Confidence interval untuk odds ratio adalah (0,4; 220,9)
dibandingkan dengan Cornfields exact dengan confidence interval (0,2;
626,2).
Secara normal, metode exact lebih dianjurkan daripada metode
approximate, meskipun metode exact termasuk metode konservatif,
terutama untuk sampel kecil.
Metode untuk data diskret yang dianggap bisa mengkompromisasi metode
konservatif dan liberal adalah dengan mid-P-value. Untuk estimasi
interval odds ratio, mid-P-value bisa sangat konservatif, namun untuk
sampel kecil, mid-P-value bisa lebih akurat dari metode liberal (Cornfield
exact interval). Contohnya untuk tabel 3.8 , dengan tingkat kepercayaan
95%, interval yang dihasilkan dengan mid-P-value adalah (0,31; 309)
mempunyai interval lebih pendek dari pada interval Cornfield yaitu (0,21;
626).
3.6.4 Inferensia Dengan Sampel Kecil untuk Perbedaan Proporsi
Pendekatan kondisional untuk menghilangkan parameter yang
mengganggu (tidak berarti) dapat dilakukan manakala tersedia statistik
yang cukup, sehingga hanya beberapa model saja yang bisa menerima
penggunaan pendekatan kondisional.
Pendekatan non-kondisional meskipun penghitungannya lebih kompleks, namun
tidak membutuhkan statistik yang cukup untuk menghilangkan parameter
pengganggu.
Misal ada parameter pengganggu =
1
+
2
. Maka bisa direkayasa dengan cara
mensubstitusikan =
1
-
2
, akan diperoleh
1
= ( + )/2 dan
2
= ( - )/2.
Untuk =
0
dan adalah fixed, maka P-value adalah supremum dari probability
semua nilai , sehingga yang muncul adalah nilai
0
yang tidak unik (lebih dari
1). Adapun confidence interval untuk
1
-
2
adalah nilai-nilai
0
dimana nilai P-
valuenya tidak lebih dari . Sebagai catatan tambahan: Penyusunan 1 Interval 2
arah lebih baik dari pada 2 interval 1 arah yang terpisah.
3.7. Perluasan Untuk Tabel Multi Arah dan Respons Tanpa Tabulasi
Merupakan perluasan tabel multi arah untuk tabel kontingensi
3.7.1 Data Kategorik yang Tidak memerlukan Tabel Kontingensi
Model untuk variable respon kategorik dapat sebaik variable penjelas
kategorik
Ketika seluruh atau sebagian besar variable adalah kategorik, maka tidak
perlu selalu menjadi tabel kontingensi, tapi dapat dibuat menjadi bentuk
garis data untuk setiap subjek
Software akan membaca data kemudian menganalisa yang mungkin akan
melibatkan tabel kontingensi.
Sebagai ilustrasi diberikan contoh berikut :
Subject Gender Race Education
Opinion
1 f w 2 1
2 m b 3 1
3 m w 1 2