Você está na página 1de 13

ANALISIS BUTIR SOAL Untuk menguji tingkat kepercayaan suatu tes, biasanya dilakukan uji coba tes itu

terhadap sejumlah subjek yang bersifat tipikal dengan populasi yang akan dites. Dengan sifat tipikal dimaksudkan untuk mengetahui efektivitas variasi butir-butir tes melalui kerja analisis butir soal (item analysis). Secara keseluruhan sebuah tes mungkin tidak percaya, akan tetapi tentunya tidak semua butir soal yang ada perlu direvisi. Tentunya terdapat sejumlah butir soal yang telah memenuhi kriteria kelayakan dan karenanya dapat dipertahankan. Untuk memilih butir-butir soal yang layak, dan sebaliknya perlu direvisi, dapat ditentukan berdasarkan kerja analisis butir soal. Analisis butir soal akan memberikan jawab terhadap maksud itu secara dapat dipertanggungjawabkan karena ia sanggup memberikan informasi secara terinci tentang keadaan masing-masing butir soal, yaitu berdasarkan tingkat kesulitan (item difficulty) dan daya pembeda (item discriminability). Sebuah butir soal dinyatakan layak jika indeks tingkat kesulitan dan daya pembedanya memenuhi standar yang ditentukan. Sebuah tes yang telah dinyatakan tepercaya melalui suatu teknik pengujian perlu juga dianalisis butir-butir soalnya. Sebab, belum tentu semua butir soal yang ada layak, mungkin terdapat sejumlah butir yang kurang layak. Hal itu pun hanya dapat diketahui secara pasti melalui analisis butir soal. Berdasarkan analisis butir soal akan dapat diperbaiki dan ditingkatkan tingkat kepercayaan sebuah tes, tes yang telah dipergunakan sebelumnya. Analisis butir soal merupakan analisis hubungan antara skor-skor butir soal dengan skor keseluruhan, membandingkan jawaban siswa terhadap suatu butir soal dengan jawaban terhadap keseluruhan tes. Tujuan analisis butir soal adalah membuat tiap butir soal itu konsisten dengan keseluruhan tes (Tuckman, 1975:271), menilai tes sebagi alat pengukuran, karena suatu alat tes jika tidak diuji, efektivitas pengukuran tidak dapat ditentukan secara memuaskan (Noll, 1979:207). Analisis butir soal dilakukan untuk mengetahui tingkat kesulitan tiap butir soal, daya pembeda, dan analisis pengecoh (distractor). Ketiga hal tersebut berikut akan dibicarakan. Sebelumnya, akan dikemukakan terlebih dahulu langkah-langkah analisis butir soal yang biasa dilakukan.

1.

Langkah-langkah Analisis Butir Soal Langkah-langkah yang dilakukan untuk menganalisis butir soal adalah sebagai berikut :

(1) Mengurutkan skor pada lembar jawaban siswa dari skor yang tertinggi berturut-turut sampai yang terbawah. (2) Mengambil sebanyak 27,5 persen dari jumlah siswa dari skor yang tertinggi dan 27,5 persen dari skor yang terendah. Kelompok yang pertama disebut kelompok tinggi (kelompok siswa yang skornya tinggi), sedang yang kedua disebut kelompok rendah dan sisanya sebagai kelompok tengah. Pembagian menjadi ketiga kelompok tersebut terutama disarankan jika jumlah siswa cukup besar, sebaliknya jika hanya sedikit cukup dibedakan menjadi kelompok tinggi dan kelompok rendah saja. (3) Menganalisis jawaban benar atau salah perbutir soal per siswa. Analisis ini hanya dilakukan terhadap jawaban siswa kelompok tinggi dan kelompok rendah, sedang kelompok tengah ditinggalkan. Berdasarkan analisis atau identifikasi ini akan dapat dihitung indeks tingkat kesulitan dan daya pembeda masing-masing butir soal. Berikut dicontohkan analisis jawaban yang dimaksud. Tabel 4.8 Analisis Butir Soal Kelompok Tinggi dan Kelompok Rendah untuk Persiapan Penghitungan Indeks Tingkat Kesulitan dan Daya Pembeda Kelompok Tinggi
Nomor Urut Subjek

Nomor butir soal


1 1 1 1 1 0 1 5 2 1 1 1 0 1 1 5 3 1 0 1 1 1 1 5 4 0 1 0 1 1 0 3 5 1 1 0 0 1 1 4 6 1 1 1 1 0 0 4 7 1 1 1 1 1 1 6 8 1 1 1 0 1 0 4 . .. . . . . . . . . .. . . . . 5 40 1 1 1 1 0 1

Jumlah Skor

1. 2. 3. 4. 5. 6.
Jumla h

36 34 30 30 28 28

Kelompok Rendah
Nomor urut subjek 1. 2. 3. 4. 5. 6. 1 1 0 0 1 0 0 2 2 1 0 1 1 1 0 4 3 0 1 1 1 0 0 3 4 1 1 0 0 0 1 3 5 0 1 0 0 1 1 3 6 0 0 1 1 1 0 3 7 1 1 0 1 1 1 5

Nomor butir soal 8


1 1 1 0 0 1 4 . . . . . ... ... .. .. .. .. 3 40 1 0 1 0 0 1

Jumlah skor

20 19 19 18 16 15

Jumlah

2.

Tingkat Kesulitan Butir Soal Tingkat kesulitan (item difficulty) adalah pernyataan tentang seberapa mudah atau sulit

sebuah butir soal bagi siswa yang dikenai pengukuran (Oller, 1979:246). Dalam hal ini, Oller sendiri lebih suka mempergunakan istilah item facility karena hal yang sebenarnya dimaksud adalah seberapa besar suatu butir soal memberi fasilitas atau kemudahan bagi siswa. Butir soal yang baik adalah yang tingkat kesulitannya cukupan, tidak terlalu mudah atau terlalu sulit. Butir soal yang terlalu mudah atau sulit sama tidak baiknya karena keduanya tak dapat membedakan antara siswa kelompok tinggi dan kelompok rendah. Butir soal yang demikian tidak memberikan informasi apa-apa tentang pembedaan prestasi antara tiap individu (Noll,1979:212) Tingkat kesulitan suatu butir soal dinyatakan dengan sebuah indeks yang berkisar antara 0,0 sampai dengan 1,0. Indeks 0,0 berarti butir soal yang bersangkutan sangat sulit karena tidak seorang siswa pun dapat menjawabnya. Sebaliknya, indeks 1,0 berarti butir soal yang bersangkutan sangat mudah karena semua siswa dapat menjawab dengan betul. Oller (1979:247) mengemukakan bahwa suatu butir soal dinyatakan layak jika indeks tingkat kesulitannya

berkisar antara 0,15 sampai dengan 0,85. Indeks yang di luar itu berarti butir soal terlalu mudah atau terlalu sulit, maka butir soal tersebut perlu direvisi atau diganti. Untuk menghitung indeks tingkat kesulitan tersebut dilakukan dengan cara sebagai berikut: jumlah jawaban betul kelompok tinggi (FH) ditambah jumlah jawaban betul kelompok rendah (FL) dibagi jumlah siswa kedua kelompok tersebut (N). Jika ditulis dengan rumus, indeks tingkat kesulitan (IF) tersebut adalah sebagai berikut IF = FH + FL ________________ N IF FH FL N = = = = (Item Facility) indeks tingkat kesulitan yang dicari (Frequency High) jumlah jawaban betul kelompok tinggi (Frequency Low) jumlah jawaban betul kelompok rendah Jumlah siswa kedua kelompok

Berdasarkan data-data di atas (Tabel 4.8) kita dapat menghitung indeks tingkat kesulitan tiap butir soal yang ada misalnya dicontohkan dibawah ini Butir nomor 1 = 5+2 ______________ 12 Butir nomor 2 = 5+4 ______________ 12 Butir nomor 3 = 5+3 _______________ 12 = 0,67 = 0,75 = 0,58

Butir nomor 4 =

3+3 _______________ 12 = 0,50

Butir nomor 7 =

6+5 ______________ 12 = 0,92

Butir nomor 10 =

5+3 ______________ 12 = 0,67

3. Daya Pembeda Butir Soal Daya pembeda (item discriminability) adalah seberapa besar suatu butir soal dapat membedakan antara siswa kelompok tinggi dan kelompok rendah. Butir soal yang baik adalah yang dapat membedakan antara kedua kelompok tersebut secara layak. Hal itu berdasarkan logika bahwa siswa dari kelompok tinggi seharusnya dapat menjawab dengan betul yang lebih banyak daripada kelompok rendah (Oller L 251, Ebel:258) Daya pembeda dihitung berdasarkan perbedaan jumlah jawaban betul untuk tiap butir soal antara kelompok tinggi dan kelompok rendah. Jika terjadi kelompok rendah menjawab betul lebih banyak daripada kelompok tinggi, butir soal yang bersangkutan kurang baik karena menyalahi logika. Lebih jauh, hal itu berarti bahwa butir soal tersebut tidak tepercaya karena tidak memiliki ketetapan internal (internal consistency, Oller:248). Butir soal yang demikian, sebagai konsekuensinya perlu direvisi atau diganti. Besar kecilnya daya pembeda suatu butir soal dinyatakan dengan suatu indeks yang berkisar antara -1,00 sampai dengan 1,00. Indeks yang semakin besar atau mendekati 1,00 butir soal yang bersangkutan semakin baik sebab semakin nyata perbedaan antara kelompok tinggi dan rendah. Indeks negatif berarti siswa kelompok rendah justru menjawab dengan betul lebih banyak daripada kelompok tinggi.

Untuk mencari indeks daya pembeda suatu butir soal dilakukan dengan cara sebagai berikut: jumlah jawaban betul kelompok tinggi dikurangi jawaban betul kelompok rendah kemudian dibagi jumlah subjek kelompok tinggi atau rendah (27,5 prosen). Jika ditulis dengan rumus, indeks daya pembeda tersebut adalah sebagai berikut ID = FH FL _________________ n ID FH FL n = = = = (Item Discriminability) indeks daya pembeda yang dicari Jumlah jawaban betul kelompok tinggi Jumlah jawaban betul kelompok rendah Jumlah subjek kelompok tinggi atau rendah, atau 27,5 prousen subjek.

Sebuah butir soal dinyatakan layak jika baik indeks tingkat kesulitan maupun daya pembeda dapat memenuhi standar yang telah ditetapkan. Indeks tingkat kesulitan mungkin telah memenuhi persyaratan, tetapi jika indeks daya pembedanya rendah, di bawah 0,25 butir soal yang bersangkutan tetap dinyatakan kurang layak. Demikian pula sebaliknya, Hal ini biasanya cukup berat dipenuhi terutama yang berkaitan dengan tuntutan indeks daya pembeda. Akan tetapi, jika butir-butir soal tes memenuhi persyaratan tersebut, tingkat kepercayaan tes akan menjadi lebih tinggi. Jika perhitungan indeks tingkat kesulitan (IF) dan indeks daya pembeda (ID) digabungkan, berdasarkan data-data seperti yang terdapat pada Tabel 4.8 di atas, hasilnya akan nampak seperti dalam Tabel 4.9 di bawah ini

Tabel 4.9 Perhitungan Indeks Tingkat Kesulitan (IF) dan Indeks Daya Pembeda (ID) Butir-butir Soal Nomor butir soal 1. 2. 3. 4. 5. 6. 7. 8. .... 40 Keterangan: FH 5 5 5 3 4 4 6 4 .... 5 FL 2 4 3 3 3 3 5 4 .... 3 IF 0,58 0,75 0,67 0,50 0,58 0,58 0,92*) 0,67 ........... 0,67 ID 0,50 0,17*) 0,33 0,00*) 0,17*) 0,17*) 0,17*) 0,00*) ........... 0,33 Keterangan Tak layak Tak layak Tak layak Tak layak Tak layak Tak layak ................

*) = Indeks yang tidak memenuhi persyaratan Perhitungan indeks tingkat kesulitan dan indeks daya pembeda dapat dilakukan dengan cara lain, yaitu dengan mempergunakan tabel analisis butir soal. Untuk maksud ini terlebih dahulu kita harus menghitung proporsi jawaban betul kelompok rendah (PL). Proporsi diperoleh dengan jumlah jawaban betul (FH atau FL) dibagi jumlah subjek (n, 27,5 persen). Setelah besarnya proporsi masing-masing kelompok ditemukan, langkah selanjutnya adalah konsultasi tabel. Berdasarkan angka-angka pada tabel 4.9 di atas, misalnya, kita dapat menghitung besarnya proporsi yang dimaksud. Butir soal nomor 1:PH= 5:6 = 0,83 sedang PL = 2:6 = 0,33 (n , 27,5 prosen =6 ) butir soal nomor 2: PH =5:6 = 0,83 sedang PL = 4:6= 0,67. Demikian seterusnya dengan nomor-nomor butir soal yang lain.

4. Analisis Distraktor

Penentuan revisi terhadap suatu butir soal tidak semata-mata berdasarkan besarnya indeks tingkat kesulitan dan daya pembeda saja, melainkan juga bagaimana sebaran distribusi frekuensi jawaban pada alternatif yang disediakan. Dengan kata lain, kita perlu juga menganalisis butir-butir pengecoh (distractors) untuk tiap kali butir soal. Dasar pemikiran analisis distribusi frekuensi tidak berbeda halnya dengan analisis daya pembeda suatu butir soal, harus ada perbedaan frekuensi jawaban antara siswa kelompok tinggi dan kelompok rendah. Untuk setiap alternatif jawaban yang betul, kelompok-kelompok tinggi harus memilih secara lebih banyak karena besarnya selisih jawaban betul inilah yang akan menentukan besar-kecilnya indeks daya pembeda. Sebaliknya, alternatif-alternatif jawaban yang merupakan distraktor, kelompok rendah harus memilih secara lebih banyak. Disamping itu, semua alternatif jawaban yang disediakan harus ada siswa yang memilihnya. Jika terjadi penyimpangan terhadap hal-hal tersebut, suatu butir disarankan untuk direvisi. Kegiatan revisi tidak harus mencakup butir soal dengan seluruh alternatif jawabannya, melainkan cukup pada alternatif yang mengalami penyimpangan saja. Untuk mengetahui efektivitas tiap alternatif jawaban, atau sebaliknya adanya penyimpangan, perlu dilakukan kegiatan analisis distraktor, karena dari kegiatan itulah akan diketahui sebaran (distribusi) frekuensi jawaban. Langkah pertama yang dilakukan yaitu setelah kita memisahkan lembar-lembar jawaban untuk siswa kelompok tinggi dan kelompok rendah, adalah menteli pilihan terhadap alternatifalternatif jawaban semua butir soal untuk seluruh siswa. Dibawah ini dicontohkan suatu model penghitungan (teli) sebaran frekuensi jawaban siswa terhadap alternatif-alternatif jawaban yang disediakan.

Analisis Butir Soal: Penghitungan Indeks Tingkat Kesulitan, Indeks Daya Pembeda dan Efektivitas Distraktor

Nomor butir soal


1.(a) b c d 2. a b c ( d) 3. a (b) c d 4. a (b) c d DST 15 2 3*) 5 15 5 10 3*) 2 6 8 4*) 2*) .. 10 4 6 -) 7 2 4 7 8 7 2*) 3 7 8 3*) 2*) .. 0,4 0 .. . 0,4 0 .. . ... . 0,5 0 0,3 5 0,40 0,00*) 0,7 5 0,3 5 0,42 0,61*) 0,7 5 0,5 0 0,55 0,41 0,63 0,27 -

KT

KR

PH

PL

Kete rang an

TL TL ..

Catatan: KT = Kelompok Tinggi KR= Kelompok Rendah TL= Tak layak ( )= Alternatif jawaban betul *) = Tidak memenuhi syarat

Butir nomor 1 : indeks tingkat kesulitan dan daya pembeda memenuhi persyaratan, tetapi alternative d perlu direvisi karena kelompok tinggi memilih lebih banyak (3) daripada kelompok rendah (0).

Butir nomor 2 : baik indeks tingkat kesulitan, indeks daya pembeda, maupun sebaran pemilihan alternative jawaban baik, dst.

5. Analisis Butir Soal Esai Untuk tes yang berbentuk esai, penghitungan indeks tingkat kesulitan dan indeks daya pembeda dipergunakan rumus (Noll, dan kawan-kawan, 1979:214-215) berikut Tingkat Kesulitan = Sh 2N + X S1 - (2N (Skor maks) X Skor min) Skor min)

_________________________________________________

Daya Pembeda =

Sh

S1 Skor min)

___________________________________ N (Skor maks Catatan : Sh S1 = = Jumlah skor betul kelompok tinggi Jumlah skor betul kelompok rendah = = Skor maksimal suatu butir soal Skor minimal suatu butir soal

Skor maks Skor min N =

Jumlah subjek kelompok tinggi atau rendah (27,5 persen)

Langkah-langkah yang ditempuh sama dengan pada analisis butir soal objektif diatas, tetapi pada langkah identifikasi jawaban benar dan salah berbeda. Pada tes esai, jawaban benar biasanya diskala misalnya antara 1 sampai dengan 5. Artinya skor minimal (jawaban salah) 1 dan skor maksimal (jawaban tepat) 5. Berikut dicontohkan identifikasi jawaban siswa per butir soal per siswa.

E. KRITERIA KEPRAKTISAN

Setelah kita mempertimbangkan (baca:menilai) tes dari segi kelayakan, kesahihan dan ketepercayaan seperti dibicarakan, kita juga masih perlu mempertimbangkan tes tersebut dari segi kepraktisan sebuah tes dapat dilihat dari segi keekonomisan, pelaksanaan, penskoran dan penginterpretasiannya.

1. Keekonomisan Pertimbangan keekonomisan melihat tes dari segi mahal atau tidaknya pelaksanaan tes yang akan dilakukan. Sebuah tes, walau dari segi kesahihan dan ketepercayaan cukup tinggi, misalnya tes standar, jika dalam pelaksanaannya menuntut biaya dan atau peralatan yang mahal yang tak dapat dijangkau oleh sekolah, kiranya juga kurang baik untuk dipilih. Tes yang baik adalah yang tidak menuntut pembiayaan yang mahal, baik yang menyangkut dalam hal pengadaan tes, pelaksanaan, maupun pemeriksaan dan pengolahan hasil tes. Pengadaan tes mungkin membutuhkan biaya yang tidak sedikit. Akan tetapi jika tes tersebut dapat dipergunakan berkali-kali, hal itu tentunya dapat dipandang baik dan dilaksanakan. Sebaliknya, pengadaan tes yang cukup mahal dan hanya dapat dipakai sekali, kalau mungkin hal itu dihindarkan.

2. Pelaksanaan Sebuah tes yang baik, dalam hal ini dilihat dari segi praktisnya, adalah tes yang mudah dilaksanakan atau diadministrasikan. Artinya, pelaksanaan tes itu tidak menuntut berbagai fasilitas yang rumit atau yang tidak dimiliki oleh

sekolah. Tes hendaknya dapat dilaksanakan secara baik hanya dengan mempergunakan fasilitas yang ada dan mudah dioperasikan. Kemudahan pengoperasian tes tersebut menyangkut kemudahan bagi guru untuk menilai hasil belajar siswa, dan kemudahan bagi siswa untuk mengerjakan tes yang diberikan. Tes yang menuntut peralatan elektronik yang rumit, misalnya akan merepotkan guru dalam mengoperasikan dan lagi hal itu akan sangat tergantung dari listrik yang mungkin terganggu. Apalagi jika dalam pelaksanaan tes tersebut guru harus mengundang operator secara khusus untuk mengoperasikan peralatan.

3. Penskoran Pemilihan sebuah tes hendaknya juga mempertimbangkan kemudahan penskoran terhadap hasil pekerjaan siswa. Sebuah tes misalnya perlu dipertimbangkan apakah ia dilengkapi dengan pedoman penilaian. Untuk tes bentuk objektif, pedoman penilaian lebih mudah disepakati atau mudah dibuat, sedang untuk tes bentuk esai akan lebih banyak menimbulkan permasalahan. Sebuah perangkat tes mungkin terdiri dari bentuk objektif dan esai sekaligus, dan yang berbentuk objektif itu sendiri terdiri dari beberapa jenis tes. Untuk kemudahan penskoran, tes semacam ini hendaknya juga dilengkapi dengan pedoman penilaian, misalnya beberapa bobot untuk masing-masing jenis tes tersebut yang tentunya tidak sama.

4. Penafsiran Kemudahan penafsiran terhadap hasil tes juga merupakan suatu hal yang perlu yang perlu dipertimbangkan. Sebuah tes yang baik tentunya disertai dengan pedoman bagaimana menafsirkan, hasil tes tersebut apakah ia menuntut

untuk ditafsirkan berdasarkan norma standar atau norma kelompok, disamping juga adanya pedoman untuk melakukan penghitungan-penghitungan.

Você também pode gostar