Você está na página 1de 28

DISTRIBUSI CHI-SQUARE &

ANALISIS FREKUENSI
o

PENDAHULUAN

SIFAT DARI DISTRIBUSI CHI-SQUARE

UJI GOODNESS OF FIT

UJI INDEPENDENSI

UJI HOMOGENITAS

PENDAHULUAN
o

Chi-distribution paling sering dimanfaatkan


pada penentuan confidence interval &
testing hypothesis mengenai variance
populasi.

Penggunaan lain: Uji Goodness-of-fit, Uji


Independensi, Uji Homogenitas

SIFAT DARI DISTRIBUSI CHI-SQUARE (1)


o

Didapat dari distribusi normal, misal dari distribusi normal


acak Y dengan mean dan variance 2 diambil secara acak
sampel dengan ukuran n=1, dan setiap nilai ditransformasikan
ke nilai z=(yi-)/. distribusi sampling z2 ternyata
mengikuti distribusi 2 dengan df=1.

2 (1)= [(y-)/]2 = z2

2 (2)= [(y1-)/]2 + [(y2-)/]2 = z12 +z22

2 (n)= z12 +z22 +z32 + . . . . . + zn2

Bentuk matematis dari distribusi chi-square:


f(u) = [1/((k/2)-1)!] x (1/2k/2) x u(k/2)-1 x e-(u/2); u>0
dimana e = 2,71828; k = jml df; u =

SIFAT DARI DISTRIBUSI CHI-SQUARE (2)


o

Mean dan variance dari distribusi 2 adalah k


dan 2k

Nilai modal adalah k-2 untuk k2 dan nol


untuk k=1

Nilai 2 antara 0 dan

Penjumlahan dua atau lebih 2 (independen)


mengikuti diatribusi 2 juga.

UJI GOODNESS OF FIT


o

Uji Goodness of fit digunakan untuk menentukan apakah


distribusi freq yang diamati cocok (kompatibel) dengan
distribusi hipotetis (misalnya diambil dari populasi dengan nilai
yang didistribusikan normal, binomial, poisson dll)

Contoh: Inpatient occupancy ratio dari 250 RS:


Inpatient Occupancy Ratio

Jumlah Rumah Sakit

0,0 39,9
40,0 49,9
50,0 59,9
60,0 69,9
70,0 79,9
80,0 89,9
90,0 99,9
100,0 109,9

16
18
22
51
62
55
22
4

Jumlah

250

Mean & St Dev


x = 69,91
s = 19,02
H0, data diambil dari pop
distribusi normal;
HA, bukan dari populasi
distribusi normal

UJI GOODNESS OF FIT


Class Interval dan Freq yang diharapkan
Class Interval
< 40,0
40,0 49,9
50,0 59,9
60,0 69,9
70,0 79,9
80,0 89,9
90,0 99,9
100,0 109,9
110,0 +
Jumlah

Z = (xi x)/s
Pada batas bawah
interval
-1,57
-1,05
-0,52
0,00
0,53
1,06
1,58
2,11

Freq relatif yang


diharapkan

Frequency yang
diharapkan

0,0582
0,0887
0,1546
0,1985
0,2019
0,1535
0,0875
0,0397
0,0174

14,55
22,18
38,65
49,62
50,48
38,38
21,88
9,92
4,35

1,0000

250,00

X2 = [(Oi-Ei)2/Ei]

UJI GOODNESS OF FIT


Freq yang diamati dan yang diharapkan, dan (O i-Ei)2/Ei
Class Interval

Freq yang diamati


(Oi)

Freq yang
diharapkan (Ei)

(Oi-Ei)2/Ei

< 40,0
40,0 49,9
50,0 59,9
60,0 69,9
70,0 79,9
80,0 89,9
90,0 99,9
100,0 109,9
110,0 +

16
18
22
51
62
55
22
4
0

14,55
22,18
38,65
49,62
50,48
38,38
21,88
9,92
4,35

0,145
0,788
7,173
0,038
2,629
7,197
0,001
3,533
4,350

Jumlah

250

250,00

25,854

X2 = [(Oi-Ei)2/Ei] = 25,854. Degree of freedom = 9 (jml klas interval 3


(untuk 3 restriksi: Ei = Oi ; memperkirakan dan dari data sampel) = 6.
20,995 = 18,548. Menolak H0 bahwa sampel berasal dari populasi distribusi
normal.

Uji Goodness of Fit


(Binomial Distribution)
o

Penelitian dirancang untuk menentukan penerimaan


pasien thd obat penghilang sakit

100 dokter masing-masing memilih 25 pasien untuk


berpartisipasi

Kita berminat untuk membuktikan apakah data


kompatibel dengan hipotesis bahwa mereka dipilih
dari populasi yang mengikuti distribusi binomial?

Hasil studi dapat dilihat pada Tabel berikut

HASIL STUDI
Juml pasien memilih obat baru
penghilang sakit (dari 25
sampel pasien)

Jumlah dokter yang


melaporkan

Total pasien memilih obat


baru yang dilaporkan
dokter

16

10

30

10

40

15

75

17

102

10

70

10

80

81

100

500

10 atau lebih
Total

HASIL STUDI
Juml pasien memilih obat
baru penghilang sakit
(dari 25 sampel pasien)

Jumlah dokter
yang melaporkan
(Oi)

Frekueansi
Relatif yang
diharapkan

Frekuensi yang
diharapkan
(Ei)

.0038

.38

.0236

2.36

.0708

7.08

10

.1358

13.58

10

.1867

18.67

15

.1960

19.60

17

.1633

16.33

10

.1109

11.09

10

.0623

6.23

.0295

2.95

.0173

1.73

100

1.0000

100.00

10 atau lebih
Total

X2 = (11-2.74)2/2.74 + (8-7.08)2/7.08 + + (0-1.73)2/1.73 = 47.624

UJI INDEPENDENSI
o DISTRIBUSI CHI-SQUARE YANG PALING SERING
DIGUNAKAN ADALAH UNTUK UJI NULL HYPOTHESIS
BAHWA DUA KRITERIA KLASIFIKASI KALAU
DITERAPKAN PADA SET ENTITAS YANG SAMA ADALAH
INDEPENDEN.
o DENGAN KATA LAIN DUA KRITERIA KLASIFIKASI
ADALAH INDEPENDEN KALAU DISTRIBUSI DARI SATU
KRITERIA ADALAH SAMA TIDAK PEDULI APA DISTRIBUSI
KRITERIA LAIN

UJI INDEPENDENSI
Distribusi 1500 subyek menurut tipe darah dan tingkat
keparahan
Kondisi
keparahan
Tidak ada

TIPE DARAH
A

AB

TOTAL

543

211

90

476

1320

Ringan

44

22

31

105

Parah

28

31

75

TOTAL

615

242

105

538

1500

Peneliti ingin mengetahui apakah data diatas sesuai dengan hipotesa


bahwa kondisi keparahan dan tipe darah adalah independen.

UJI INDEPENDENSI
Frekuensi yang diamati dan yang diharapkan
Kondisi
keparahan
Tidak ada

TIPE DARAH
A

AB

TOTAL

543 (541,2)

211 (212,96)

90 (92,40)

476 (473,44)

1320

Ringan

44 (43,05)

22 (16,94)

8 (7,35)

31 (37,66)

105

Parah

28 (30,75)

9 (12,10)

7 (5,25)

31 (26,90)

75

TOTAL

615

242

105

538

Kalau dua kejadian independen maka peluang untuk joint occurrence =


perkalian dari peluang masing-masing.
P(kondisi ringan tipe darah A)=(105/1500)*(615/1500)
Frekuensi yang diharapkan=(105*615)/1500=43,05

1500

UJI INDEPENDENSI
2 = [(Oi-Ei)2/Ei]
= [(543-541,2) 2/541,2] + .......... +
[(31-26,90) 2/26,90]
= 0,005987+..................+0,624907
= 5,12
Df = (r-1)(c-1) = (3-1)(4-1) = 6
Untuk =10%, nilai kritis 2 = 10,645
Kesimpulan?

UJI HOMOGENITAS
o Uji independensi dibedakan dari uji homogenitas dilihat dari
prosedur sampling, pertanyaan dan null-hypothesis yang berbeda.
o Pada uji independensi distribusi pada tiap cell didapat setelah
sampel dipilih (satu sample dari satu populasi) dan dikaitkan
dengan pertanyaan: APAKAH DUA KRITERIA KLASIFIKASI INDEPENDEN?
o Pada uji homogenitas distribusi cell didapat dari sampel independen
dari beberapa populasi, dan dikaitkan dengan pertanyaan: APAKAH
SAMPEL DIPILIH DARI POPULASI YANG HOMOGEN DENGAN
MEMPERHATIKAN BEBERAPA KRITERIA KLASIFIKASI? DENGAN KATA
LAIN DUA KRITERIA KLASIFIKASI ADALAH INDEPENDEN KALAU
DISTRIBUSI DARI SATU KRITERIA ADALAH SAMA TIDAK PEDULI APA
DISTRIBUSI KRITERIA LAIN

UJI HOMOGENITAS
Keterlibatan dalam penggunaan obat pada 510
mahasiswa suatu PT menurut tingkat kelas
Tingkat kelas

KETERLIBATAN PENGGUNAAN OBAT

TOTAL

Coba-coba

Biasa

Moderat/berat

Mhsw baru

57

50

43

150

Mhsw tk II

57

58

20

135

Mhsw Yunior

56

45

24

125

Mhsw senior

45

22

33

100

TOTAL

215

175

120

510

Sampel dari 4 populasi: mhsw baru, tk II, junior dan senior.


Apakah data kompatibel dengan hipotesa bahwa 4 populasi homogen terkait dengan keterlibatan penggunaan obat?

UJI HOMOGENITAS
Frekuensi yang diamati dan yang diharapkan
Tingkat kelas

KETERLIBATAN PENGGUNAAN OBAT

TOTAL

Coba-coba

Biasa

Moderat/berat

Mhsw baru

57 (63,24)

50 (51,47)

43 (35,29)

150

Mhsw tk II

57 (59,61)

58 (46,32)

20 (31,76)

135

Mhsw Yunior

56 (52,70)

45 (42,89)

24 (29,41)

125

Mhsw senior

45 (42,16)

22 (34,31)

33 (23,53)

100

215

175

120

510

TOTAL

Kalau populasi homogen, atau sampel diambil dari populasi yang sama dilihat
dari keterlibatan penggunaan obat, maka estimasi terbaik dari proporsi
populasi yang menggunakan obat coba-coba adalah 215/510 = 0,4216

UJI HOMOGENITAS
2 = [(Oi-Ei)2/Ei]
= [(57-63,24) 2/63,24] + [(50-51,47)2/51,47] +
........ + [(33-23,53)2/23,53]
= 19,4
Df = (r-1)(c-1) = (4-1)(3-1) = 6
Untuk 2 = 19,4 nilai p < 0,005
Kesimpulan?

NON PARAMETRIC
DISTRIBUTION FREE STATISTICS

PENDAHULUAN
PARAMETRIC STATISTICSC VS NON PARAMETRIC
STATISTICS
PARAMETRIC

STATISTICS

Minat

untuk estimasi atau testing hipotesa tentang


satu atau lebih parameter populasi

Penerapan

prosedur perlu pengetahuan tentang


bentuk fungsi populasi dari mana sampel sebagai
basis inference diambil

PENDAHULUAN
NON

PARAMETRIC STATISTICS

Fokus

pada prosedur testing hipotesanya, bukan


pada estimasi atau hipotesa parameter populasi
dan tidak menggantungkan pengetahuan tentang
populasi yang disampel.

Prosedur

tanpa mengasumsikan populasi yang


disampel disebut DISTRIBUTION-FREE
PROCEDURES

PENDAHULUAN
NON PARAMETRIC STATISTICS:
KEUNTUNGAN

Testing hipotesa tanpa menyebutkan nilai parameter


populasi

Digunakan ketika bentuk sampel dari populasi tidak


diketahui

Mudah perhitungannya

Dapat diterapkan untuk data ranking dan klasifikasi

PENDAHULUAN
NON PARAMETRIC STATISTICS:
KERUGIAN

Mubazir digunakan untuk data yang dapat dihandle


dengan prosedur parametric

Untuk sampel besar penggunaan berbagai test non


parametric menjadi sulit.

CHI-SQUARE: test of goodness of


fit, test of homogeneity & test of
independence masuk kategori
NON PARAMETRIC TEST

SKALA PENGUKURAN
(MEASUREMENT SCALES)
PROPERTY

SCALE
NOMINAL

ORDINAL

INTERVAL

RATIO

1. CLASSIFICATION

2. ORDERING

3. DISTANCE

4. NON ARBITRARY ZERO

THE SIGN TEST


k = jumlah tanda (sign) negative, distribusi sampling
dari k mengikuti peluang distribusi binomial dengan
p=0.5

Table 1
General appearance scores
of mentally retarted girls
Girl

Score

Girl

Score

1
2
3
4
5

4
5
8
8
9

6
7
8
9
10

6
10
7
6
6

H0: P(+) = P(-) = 0.5


Evaluasi peluang mengamati jumlah x atau kurang
dari tanda (sign) negative jika sampel dengan ukuran
n dan parameter p mengikuti distribusi binomial atau:
P(k x n, p) = (nk) pkqn-x

Table 2
Score above (+) and below (-) the hypothesized median
based on data Table 1
Girl
Score relative
to hypothesized median

10

THE MEDIAN TEST


Table 1
Level dari score kesehatan mental
anak laki-laki SMP (urban=16;
rural=12)
Urban
35
26
27
21
27
38
23
25

Rural
29
50
43
22
42
47
42
32

Urban
25
27
45
46
33
26
46
41

Median = (33+34)/2= 33.5

Rural
50
37
34
31

Table 2
Level of mental health scores of Junior School Boys
Jumlah scores diatas median
Jumlah scores dibawah median
Total

Urban

Rural

Total

6
10
16

8
4
12

14
14
28

Apakah dapat disimpulkan ada perbedaan


median mental health score antara murid
laki-laki di perdesaan dan perkotaan (=0.05)?
2 = {28[(6)(4) (8)(10)]2}/[(16)(12)(14)(14)] =
2.33
2 hitung = 2.33
Kesimpulan?

X2 kritis = 3.841

NON PARAMETRIC TEST LAINNYA


o THE COLMOGOROV-SMIRNOV GOODNESS OF FIT TEST
o THE KRUSKAL-WALLIS ONE WAY ANALYSIS OF VARIANCE BY RANKS
o THE FRIEDMAN TWO-WAY ANALYSIS OF VARIANCE BY RANKS
o THE SPIERMAN RANK CORRELATION COEFFICIENT
NON PARAMETRIC STATISTICAL TEST BISA DIMANFAATKAN
APABILA ASSUMPTION UNDERLYING THE PARAMETRIC TEST
TIDAK DAPAT DIREALISASIKAN ATAU APABILA DATA DIUKUR DALAM
SKALA YANG LEMAH UNTUK PROSEDUR YANG DIPERLUKAN UNTUK
PARAMETRIC TESTS

Você também pode gostar