Você está na página 1de 23

EVALUASI PEMBELAJARAN BIOLOGI

“ Analisis Butir Soal ”

Disusun oleh:
Kelompok 11
Eka Purwanti (1610211009)
Windasari (1610211015)
Ria Ade Noer Hazila (1610211026)

PROGAM STUDI PENDIDIKAN BIOLOGI


JURUSAN PENDIDIKAN MIPA
FAKULTAS KEGURUAN DAN ILMU PENDIDIKAN
UNIVERSITAS MUHAMMADIYAH JEMBER
2018
PENDAHULUAN

Dalam dunia pendidikan, penilaian merupakan bagian yang tidak terpisahkan dari proses
belajar mengajar. Sistem penilaian yang baik akan mendorong guru menggunakan strategi
mengajar yang lebih baik dan memotivasi anak untuk belajar lebih giat. Penilaian biasanya
dimulai dengan kegiatan pengukuran. Pengukuran (measurement ) merupakan cabang ilmu
statistika terapan yang bertujuan untuk membangun dasar-dasar pengembangan tes yang lebih
baik sehingga menghasilkan tes yang berfungsi secara optimal, valid, dan reliabel. Proses belajar
mengajar dilaksanakan tidak hanya untuk kesenangan atau bersifat mekanis saja tetapi
mempunyai misi atau tujuan bersama. Dalam usaha untuk mencapai misi dan tujuan itu perlu
diketahui apakah usaha yang dilakukan sudah sesuai dengan tujuan? Untuk mengetahui apakah
tujuan pendidikan sudah tercapai perlu diadakan tes. Sebuah tes yang dapat baik sebagai alat
pengukur harus dianalisis terlebih dahulu. Dalam menganalisis butir soal dalam tes harus
memperhatikan daya serap, tingkat kesukaran, daya beda, fungsi pengecoh, validitas dan
reabilitas. Analisis butir soal atau analisis item adalah pengkajian pertanyaan-pertanyaan tes agar
diperoleh perangkat pertanyaan yang memiliki kualitas yang memadai. Menganalisis butir soal
merupakan suatu kegiatan yang harus dilakukan guru untuk meningkatkan mutu soal yang
dibuat. Kegiatan ini merupakan proses pengumpulan, peringkasan, dan penggunaan informasi
dari jawaban siswa untuk membuat keputusan tentang setiap penilaian. Soal yang bermutu
adalah soal yang dapat memberikan informasi setepat-tepatnya sesuai dengan tujuannya di
antaranya dapat menentukan peserta didik mana yang sudah atau belum menguasai materi yang
diajarkan guru (Sartika, 2013). Dalam analisis butir soal terdapat dua istilah yang digunakan
yaitu karakteristik dan spesifikasi butir soal. Analisis soal secara kuantitatif menekankan pada
karakteristik internal tes melalui data yang diperoleh secara empiris. Dalam menentukan
karakteristik butir soal, pada umumnya dipertimbangkan tiga hal, yaitu: (1) tingkat kesukaran,
(2) daya beda, dan (3) berfungsi tidaknya pilihan jawaban atau pengecoh. Karakter-karakter butir
soal tersebut sangat menentukan kualitas butir soal. Mengukur tingkat kesukaran, daya pembeda,
dan pengecoh diharapkan akan mampu memberikan informasi yang akurat tentang kemampuan
siswa yang sebenarnya. Pengukuran tingkat pengecoh soal dipergunakan pada analisis soal
pilihan ganda yang memiliki alternatif jawaban lebih dari satu, sedangkan pada soal uraian tidak
memiliki pengecoh soal.
KAJIAN TEORI

A. Pengertian Analisis Butir Soal


Analisis butir soal adalah pengkajian pertanyaan-pertanyaan dalam suatu perangkat tes
agar diperoleh perangkat penilaian yang memiliki kualitas yang memadai. Analisis butir soal
dapat dilakukan secara kualitatif dan kuantitatif. Analisis butir soal secara kualitatif
dilakukan dengan menelaah setiap butir soal pertanyaan. Setelah butir soal untuk instrumen
tes/ujian ataupun instrumen non-tes disusun, maka perlu diselidiki kualitasnya dengan cara
ditelaah oleh teman sejawat. Langkah ini dikenal dengan analisis instrumen secara kualitatif.
Dalam melakukan penyelidikan kualitas butir soal tes hasil belajar, penelaahan perangkat
penilaian difokuskan kepada pemenuhan aspek materi/substansi, aspek konstruksi, dan
aspek bahasa. Ada dua jenis analisis butir soal secara kuantitatif, yaitu menganalisis tingkat
kesukaran butir soal dan analisis daya pembeda. Menganalisis tingkat kesukaran suatu butir
soal artinya mengkaji butir soal dalam tes dari segi kesulitannya, sehingga dapat diperoleh
informasi mana butir soal yang termasuk mudah, sedang dan sukar. Sedangkan menganalisis
daya pembeda artinya mengkaji butir soal tes dari segi kesanggupan tes tersebut dalam
membedakan siswa yang termasuk kategori rendah ataupun tinggi prestasinya.
Selain itu, untuk soal berbentuk pilihan berganda perlu dilakukan analisis distraktor
untuk mengetahui apakah pilihan jawaban (option) berfungsikah atau tidak. Secara teknis,
dilakukan uji coba perangkat penilaian dahulu agar diperoleh data yang digunakan untuk
penentuan daya pembeda, tingkat kesukaran dan analisis distraktor. Hasil analisis
selanjutnya digunakan untuk dasar keputusan, apakah butir soal dapat digunakan ataukah
perlu diperbaiki atau dibuang.
Analisis butir soal merupakan suatu prosedur yang sistematis, yang akan memberikan
informasi-informasi yang sangat khusus terhadap butir tes yang akan kita susun. Analisis
butir soal pada dasarnya bertujuan untuk mengetahui apakah setiap item soal benar-benar
baik, sehingga diperlukan analisis terhadapnya. Analisis item soal terutama dapat dilakukan
untuk tes objektif. Dimana tes objektif merupakan alat evaluasi (hasil belajar mengajar)
yang mengukur kepada objek-objeknya. Hal ini tidak berarti bahwa tes uraian tidak dapat
dianalisis, akan tetapi memang dalam menganalisis butir tes uraian belum ada pedoman
secara standar.
Tentang kegunaan analisis terhadap item soal pada umumnya dilakukan terhadap
beberapa hal yaitu:
1. Seberapa besar tingkat kesukaran pada butir/item soal.
2. Apakah butir item itu mampu membedakan kemampuan antara siswa pandai dan kurang
pandai.
3. Apakah butir item tersebut menggunakan distraktor yang baik atau belum.
Maka dari itu dengan analisis item soal dapat diperoleh informasi tentang kejelekan
sebuah soal dan petunjuk untuk mengadakan perbaikan. Kriteria kualitas butir soal:
a. Validitas Butir Soal (Analisis Butir)
Validitas keseluruhan soal berkualitas erat dengan validitas tiap butir soal. Apabila tiap
butir soal mempunyai validitas yang tinggi dalam hubungannya dengan skor total, maka
instrumen itu pada akhirnya juga mempunyai validitas yang tinggi. Andai kata ada butir
soal yang kurang tepat, maka butir soal itu perlu disempurnakan, diganti, sehingga butir
soal yang digunakan mempunyai validitas yang baik. Sehubungan dengan itu, kisi-kisi
yang disusun hendaklah betul-betul mewakili (representativeness) konstruk atau aspek
yang ingin diukur, baik dilihat dari proporsinya maupun dari aspek yang diukur.
Beberapa rumus yang digunakan yaitu product moment correlation dan korelasi bilateral
(Muri, 2014:239).
Dalam membuat butir soal evaluasi guru harus memperhatikan kurikulum tingkat
satuan pendidikan yang digunakan. Menurut Thoha “Suatu alat evaluasi dikatakan baik
yaitu memiliki validitas yang mana alat evaluasi tersebut dapat mengukur apa yang harus
diukur dan memiliki realibilitas yaitu evaluasi yang memiliki kehandalan dan bersifat
konsisten dari suatu pengukuran yang dilakukan”.
b. Reliabilitas
Reliabilitas adalah suatu hal yang sangat penting pada alat pengukuran standar.
Reliabilitas dihubungkan dengan pengertian adanya ketepatan tes dalam pengukurannya.
Reliabilitas adalah kestabilan skor yang diperoleh peserta tes yang sama ketika diuji
ulang dengan tes yang sama pada situasi yang berbeda atau dari suatu pengukuran ke
pengukuran lainnya. Dengan kata lain reliabilitas merupakan tingkat konsistensi atau
kemantapan hasil terhadap hasil dua pengukuran hal yang sama. Dapat juga diartikan
sebagai tingkat kepercayaan dari suatu alat ukur (Depdikbud : 1997). Hasil pengukuran
diharapkan akan sama apabila pengukuran itu diulangi. Dengan perangkat tes yang
reliabel, apabila tes itu diberikan dua kali pada peserta yang sama tetapi dalam selang
waktu yang berbeda sepanjang tidak ada perubahan dalam kemampuan maka skor yang
diperoleh akan konstan. Kriteria untuk menentukan tinggi rendahnya reliabilitas sebuah
perangkat tes, menurut dapat dilihat pada rentangan koefesien korelasi sebagai berikut :
Tabel. Klasifikasi Tingkat Reliabilitas Tes

B. Tujuan dan Manfaat Kegiatan Analisis Butir Soal


1. Tujuan Kegiatan Analisis Butir Soal
Beberapa tujuan dari kegiatan analisis butir soal adalah sebagai berikut.
a. Mengkaji dan menelaah setiap butir soal agar diperoleh soal yang bermutu,
b. Meningkatkan kualitas butir tes melalui revisi atau membuang soal yang tidak efektif
(tidak valid),
c. Mengetahui informasi diagnostik pada peserta didik tentang pemahaman materi yang
diajarkan.
2. Manfaat Kegiatan Analisis Butir Soal
Analisis butir soal memiliki banyak manfaat, antara lain sebagai berikut.
a. Membantu pengguna tes dalam mengevaluasi kualitas tes yang digunakan,
b. Sesuai untuk penyusunan tes informal, seperti tes yang disiapkan guru untuk peserta
didik.
c. Mendukung penulisan soal yang efektif dan berkualitas.
d. Meningkatkan validitas dan reliabilitas soal sehingga tercipta soal yang berkualitas.
e. Sangat relevan bagi penyusun tes informal dan lokal seperti tes yang disiapkan guru
untuk siswa di kelas.
f. Secara material dapat memperbaiki tes di kelas, dan untuk meningkatkan validitas
dan realibilitas (Anastasi dan Urbina, 1997:172)
Melalui kegiatan analisis butir soal, guru akan dapat menentukan soal-soal yang baik
dan soal-soal yang cacat atau tidak berfungsi dengan baik. Selain itu, guru dapat merevisi
soal-soal yang sudah tidak relevan dengan materi yang diajarkan dengan melihat
banyaknya peserta didik yang tidak mampu menjawab butir soal tertentu.

C. Teknik Analisis Butir Soal


Analisis soal dilakukan untuk mengetahui tercapai atau tidaknya tujuan sebuah soal.
Selanjutnya, analisis butir soal dapat dilakukan secara kualitatif (berkaitan dengan isi dan
bentuknya) dan kuantitatif (berkaitan dengan ciri-ciri statistiknya). Analisis kualitatif
mencakup pertimbangan validitas isi dan konstruksi, sedangkan analisis kuantitatif
mencakup pengukuran validitas dan reliabilitas butir soal, kesulitan butir soal serta
diskriminasi soal. Soal yang bermutu adalah soal yang dapat memberikan informasi setepat-
tepatnya tentang siswa mana yang telah menguasai materi dan siswa mana yang belum
menguasai materi. Kedua teknik ini masing-masing memiliki keunggulan dan kelemahan,
oleh karena itu teknik terbaik adalah menggunakan atau memadukan keduanya. Analisis
pada umumnya dilakukan melalui dua cara, yaitu analisis kualitatif (qualitatif control) dan
analisis kuantitatif (quantitatif control).
1. Analisis Butir Soal Secara Kualitatif
Dalam analisis butir soal secara kualitatif digunakan format penelaahan soal.
Biasanya hal-hal yang ditelaah dalam analisis kualitatif adalah hal-hal yang terkait materi
soal dan kaitannya dengan bahasa serta budaya di masyarakat tempat soal tersebut akan
diujikan. Ada beberapa teknik yang digunakan untuk menganalisis butir soal secara
kualitatif, yaitu teknik moderator dan teknik panel. Teknik moderator merupakan teknik
berdiskusi yang di dalamnya terdapat satu orang sebagai penengah. Berdasarkan teknik
ini, setiap butir soal didiskusikan secara bersama-sama dengan beberapa ahli.
Sedangkan teknik panel adalah teknik menelaah butir soal berdasarkan kaidah
penulisan butir soal. Kaidah itu diantaranya adalah materi, kontruksi, bahasa atau budaya,
kebenaran kunci jawaban. Caranya beberapa penelaah diberikan beberapa butir soal yang
akan ditelaah, format penelaahan, dan pedoman penelaahan.
Dalam menganalisis butir soal secara kualitatif penggunaan format penelaahan soal
akan membantu dan mempermudah prosedur pelaksanaannya.Format penelaahan soal
digunakan sebagai dasar untuk menganalisis setiap butir soal.
2. Analisis Butir Soal Secara Kuantitatif
Penelaahan soal secara kuantitatif adalah penelaahan butir soal didasarkan pada
bukti empirik. Analisis butir soal secara kuantitatif merupakan analisis soal tahap kedua
(Tobari, 2015:39). Salah satu tujuan utama pengujian butir-butir soal secara emperik
adalah untuk mengetahui sejauh mana masing-masing butir soal membedakan antara
mereka yang tinggi kemampuannya dalam hal yang didefinisikan oleh kriteria dari
mereka yang rendah kemampuannya.
Data empirik ini diperoleh dari soal yang telah diujikan. Ada dua pendekatan dalam
analisis secara kuantitatif yaitu pendekatan secara klasik dan modern. Analisis butir soal
secara klasik adalah proses penelaahan butir soal melalui informasi dari jawaban peserta
tes guna meningkatkan mutu butir soal yang bersangkutan dengan menggunakan teori tes
klasik. Pada teori tes klasik, analisis item tes dilakukan dengan memperhitungkan
kedudukan item dalam suatu kelas atau kelompok. Karakteristik atau kualitas item sangat
tergantung pada kelompok dimana diuji cobakan sehingga kualitas item terikat pada
sampel responden atau peserta tes yang memberikan respons (sample bounded).
Ada beberapa kelebihan analisis butir soal secara klasik adalah murah, sederhana,
familiar, dapat dilaksanakan sehari-hari dengan cepat menggunakan komputer dan dapat
menggunakan beberapa data dari peserta tes. Aspek yang perlu diperhatikan dalam
analisis butir soal secara klasik adalah setiap butir soal ditelaah dari segi tingkat
kemudahan butir, daya pembeda, dan penyebaran pilihan jawaban(untuk soal bentuk
objektif). Analisis butir soal secara modern adalah penelaahan butir soal dengan
menggunakan teori respon butir atau item response theory. Teori ini merupakan suatu
teori yang menggunakan fungsi matematika untuk menghubungkan antara peluang
menjawab benar suatu butir dengan kemampuan siswa.
Pranata (1994) mengungkapkan bahwa secara kuantitatif, soal yang baik harus
memenuhi lima persyaratan, yaitu:
1. Bersifat objektif
2. Bersifat baku
3. Memiliki daya pembeda yang baik
4. Memiliki tingkat kesukaran yang baik
5. Memiliki realiabilitas yang baik
Teori ini muncul karena adanya beberapa keterbatasan pada analisis secara klasik, yaitu:
a. Tingkat kemampuan dalam teori klasik adalah true score. Artinya, jika suatu tes sulit
maka tingkat kemampuan peserta tes akan rendah, sebaiknya jika suatu tes mudah
maka tingkat kemampuan peserta tes tinggi.
b. Tingkat kesukaran butir soal didefinisikan sebagai proporsi peserta tes yang menjawab
benar. Mudah atau sulitnya butir soal tergantung pada kemampuan peserta tes.
c. Daya pembeda, reliabilitas, dan validitas tes tergantung pada kondisi peserta tes.

Menurut M.Nasir dkk (2012) banyak guru-guru yang di sekolah tidak melakukan
analisis butir soal untuk evaluasi disebabkan karena:
1. Kekurangan waktu untuk melakukan analisis
2. Analisis butir soal dirasakan masih sukar karena melibatkan rumus-rumus yang komplit
dan melelahkan.
3. Tidak adanya/belum adanya alat bantu yang memudahkan untuk melakukan analisis
butir soal.

D. Parameter Item Tes yang Baik


Sebagaimana telah disebut sebelumnya, bahwa item tes yang baik adalah item yang
memenuhi syarat sebagaimana kriteria atau karakteristik item tes yang baik. Karakteristik
item yang dimaksud adalah tingkat kesulitan atau kesukaran, daya pembeda, dan efektivitas
pengecoh.
1. Tingkat Kesulitan atau Kesukaran
Adapun tindak lanjut setelah penentuan indeks kesukaran sebagai berikut.
a. Untuk butir soal yang termasuk dalam kategori baik (dalam arti derajat kesukaran butir
soalnya cukup atau sedang), maka butir-butir soal itu dicatat dalam buku bank soal,
selanjutnya butir soal tersebut dapat dikeluarkan lagi dalam tes-tes hasil belajar pada
waktu yang akan datang.
b. Untuk butir soal yang termasuk dalam kategori terlalu sukar, ada tiga kemungkinan
tindak lanjut, yaitu:
1. Butir soal itu dibuang dan tidak digunakan lagi dalam tes hasil belajar berikutnya.
2. Diteliti ulang, sehingga dapat diketahui faktor yang menyebabkan butir soal itu sulit
dijawab oleh siswa; apakah kalimat butir soalnya kurang jelas, apakah petunjuk
cara mengerjakan butir soal itu sulit dipahami, ataukah dalam butir soal tersebut
terdapat istilah-istilah yang tidak jelas dan sebagainya. Setelah dilakukan perbaikan,
butir-butir soal tersebut digunakan dalam tes hasil belajar berikutnya.
3. Butir-butir soal yang termasuk ke dalam kategori sukar itu tetap dapat digunakan
dalam tes (terutama tes seleksi) yang sifatnya sangat ketat. Hal itu dimaksudkan
supaya sebagian besar dari testee (yang diuji) tidak lulus dalam tes seleksi tersebut.
c. Untuk butir soal yang termasuk dalam kategori terlalu mudah, ada dua kemungkinan
tindak lanjutnya, yaitu:
1. Butir soal tersebut dibuang dan tidak digunakan untuk tes-tes berikutnya.
2. Diteliti ulang, fakta apa yang menyebabkan butir soal tersebut dapat dijawab betul
oleh hampir seluruh testee, ada kemungkinan option atau alternatif yang
dipasangkan pada butir soal-soal itu “terlalu kentara” atau “terlalu mudah
diketahui” oleh testee.
Tingkat kesukaran soal adalah peluang menjawab benar suatu soal pada tingkat
kemampuan tertentu yang biasanya dinyatakan dalam bentuk indeks. Tingkat
kesukaran dinyatakan dalam indeks kesukaran (dificulty index), yaitu angka yang
menunjukkan proporsi siswa yang menjawab benar soal tersebut. Semakin besar
indeks tingkat kesukaran yang diperoleh dan hasil hitungan, berarti semakin mudah
soal itu.

Dalam hal ini, item yang baik adalah item yang tingkat kesukarannya dapat
diketahui, tidak terlalu sukar dan tidak terlalu mudah. Sebab, tingkat kesukaran item
itu memiliki korelasi dengan daya pembeda. Bilamana item memiliki tingkat
kesukaran yang maksimal, maka daya pembedanya akan rendah, demikian pula bila
item itu terlalu mudah maka tidak akan memiliki daya pembeda.
Oleh karena itu, sebaiknya tingkat kesukaran soal itu dipertahankan dalam batas
yang mampu memberikan daya pembeda. Namun, jika terdapat tujuan khusus dalam
penyusunan tes, maka tingkat kesukaran itu bisa dipertimbangkan. Misalnya, tingkat
kesukaran item untuk tes sumatif berbeda dengan tingkat kesukaran pada tes
diagnostik. Untuk menghitung taraf kesukaran soal dari suatu tes dipergunakan rumus
sebagai berikut:
𝐔+𝐋
TK =
𝐓
Keterangan:
U = jumlah siswa yang termasuk kelompok pandai (upper group) yang menjawab
benar untuk tiap soal.
L = jumlah siswa yang termasuk kurang (lower group) yang menjawab benar untuk
tiap soal.
T = jumlah siswa dari kelompok pandai dan kelompok kurang (jumlah upper group
dan lower group)
Misalkan suatu tes yang terdiri atas N soal yang diberikan kepada 40 siswa. Dari hasil
tes tersebut, tiap-tiap soal dianalisis taraf kesukarannya, mula-mula hasil tes itu kita
susun ke dalam peringkat, kemudian kita ambil 25% (10 lembar jawaban siswa
kelompok pandai), dan 10 lembar jawaban siswa dari kelompok yang kurang pandai.
Kemudian kita tabulasikan. Misalkan dari tabulasi soal kita peroleh hasil sebagai
berikut: yang menjawab benar dari kelompok pandai ada 9 siswa, dan yang menjawab
benar dari kelompok kurang pandai ada 4 siswa.
Dengan menggunakan rumus diatas, maka taraf kesukaran atau TK dari soal adalah:
𝐔+𝐋 𝟗+𝟒
TK = = = 0,65 atau 65%
𝐓 𝟐𝟎
Jadi dapat disimpulkan bahwa nilai dari TK atau tingkat kesukarannya adalah 65%.
Sedangkan dalam bukunya Drs. H. Daryanto, rumus untuk mencari taraf kesukaran
atau indeks kesukaran adalah:
P= B
JS
Keterangan:
P = indeks kesukaran
B = banyaknya siswa yang menjawab soal itu dengan benar.
JS = jumlah seluruh siswa peserta tes.
Contoh:
Jumlah siswa peserta tes dalam suatu kelas ada 40 siswa. Dari 40 siswa tersebut
terdapat 12 siswa yang mampu mengerjakan soal no. 1 dengan benar. Maka berapa
indeks kesukarannya?
Jawab:
P = B
JS
= 12
40
= 0,30
Menurut ketentuan yang sering diikuti, indeks kesukaran sering diklasifikasikan
sebagai berikut:
a. Soal dengan P 0,00 sampai 0,30 adalah soal sukar.
b. Soal dengan P 0,30 sampai 0,70 adalah soal sedang.
c. Soal dengan P 0,70 sampai 1,00 adalah soal mudah.
2. Daya Pembeda
Perhitungan daya pembeda adalah pengukuran sejauh mana suatu butir soal
mampu membedakan peserta didik yang sudah menguasai kompetensi dengan peserta
didik yang belum atau kurang menguasai kompetensi berdasarkan kriteria tertentu.
Semakin tinggi koefisien daya pembeda suatu butir soal, semakin mampu butir soal
tersebut membedakan antara peserta didik yang menguasai kompetensi dengan
pesertan didik yang kurang menguasai kompetensi.
Angka yang menunjukkan besarnya daya pembeda disebut indeks diskriminasi. Daya
pembeda suatu soal tes dapat dihitung dengan menggunakan rumus sebagai berikut:
𝐔−𝐋
DP = 𝟏
𝐓
𝟐

Keterangan:
DP = indeks DP atau daya pembeda yang dicari.
U = jumlah siswa yang termasuk dalam kelompok pandai yang mampu menjawab
benar untuk tiap soal.
L = jumlah siswa yang termasuk kurang yang menjawab benar untuk tiap soal.
T = jumlah siswa keseluruhan.
Contoh:
Dari hasil tes lomba olimpiade IPS, jumlah siswa yang dites adalah 40 siswa,
sedangkan tes tersebut terdiri dari 20 soal. Setelah hasil tes tersebut diperiksa,
kemudian disusun ke dalam peringkat untuk menentukan 25% siswa yang termasuk
kelompok pandai (upper group) dan 25% siswa yang termasuk kelompok
kurang (lower group).
Kemudian hasil tes tersebut ditabulasikan dengan menggunakan format tabulasi
jawaban tes, kemudian hasil tabulasi dari kedua kelompok tersebut dimasukkan ke
dalam format analisis soal tes, sehingga kita dapat menghitung tingkat kesukaran dan
daya pembeda tiap soal yang kita analisis.
Misalkan dari tabulasi soal no. 1 kita peroleh hasil sebagai berikut: yang menjawab
benar dari kelompok pandai ada 10 siswa, dan yang menjawab benar dari kelompok
kurang ada 9 siswa. Maka daya pembedanya adalah:
DP = U – L
½T
= 10 – 9
½ x (20)
= 1
10
= 0,10
Jadi dapat disimpulkan bahwa indeks pembedanya adalah 0,10.
Dalam bukunya Prof. Dr. Suharsimi Arikunto, dijelaskan mengenai klasifikasi daya
pembeda, yaitu:
D = 0,00 – 0,20 = jelek (poor).
D = 0,20 – 0,40 = cukup (satisfactory).
D = 0,40 – 0,70 = baik (good).
D = 0,70 – 1,00 = baik sekali (excellent).
3. Analisis pengecoh (Efektifitas Distraktor )
Analisis distraktor (pengecoh) dilakukan untuk mengetahui keberfungsian suatu
pilihan (option) jawaban dalam soal berbentuk pilihan ganda. Distraktor (pengecoh) yang
tidak dipilih sama sekali oleh testee (yang diuji/siswa) menunjukkan pengecoh tersebut
buruk, kemungkinan terlalu mencolok dan menyesatkan. Sebuah distraktor dikatakan
berfungsi, apabila paling sedikit dipilih oleh 5% pengikut tes.
Contoh:
Dari analisis sebuah soal yang mempunyai empat pilihan jawaban (Option), diperoleh
pola jawaban sebagai berikut.

Siswa Option Tidak Jumlah


menjawab(omit)
A B C D

Kelompok atas 5 7 5 3 0 30

Kelompok 8 8 6 5 3 30
bawah

Jumlah 13 15 21 9 3 60

% pemilih 22% 25% 35% 15% 5% 100%

Keterangan: Option C adalah kunci jawaban


Berdasarkan data di atas dapat dihitung berapa persen masing-masing option dipilih oleh
peserta ujian (testee). Apabila sudah dipilih oleh lebih dari 15% peserta, maka option
tersebut sudah berfungsi menjadi distraktor yang baik. Dilihat dari segi omit (peserta
yang tidak menjawab), butir soal termasuk baik, bila omitnya kurang dari 5% peserta tes.
Untuk soal butir diatas, setiap option sudah dipilih oleh lebih dari 5% peserta tes
dan omitnya tidak lebih dari 5%. Adapun daya pembeda (D) dan indeks tingkat
kesukaran (P) butir soal tersebut dapat dihitung, masing-masing adalah D = 0,30 dan P =
0,35.
Instrumen evaluasi yang berbentuk tes dan objektif, selain harus memenuhi
syarat-syarat yang telah disebutkan terdahulu, harus mempunyai distraktor yang efektif.
Yang disebut dengan distraktor atau pengecoh adalah opsi-opsi yang bukan merupakan
kunci jawaban (jawaban benar).

Butir soal yang baik pengecohnya akan dipilih secara merata oleh peserta didik
yang menjawab salah. Sebaliknya, butir soal yang kurang baik, pengecohnya akan dipilih
secara tidak merata. Pengecoh dianggap baik bila jumlah peserta didik yang memilih
pengecoh itu sama atau mendekati jumlah ideal. Indeks pengecoh dihitung dengan rumus:
IP = P x 100%
(N - B) (n - 1)
Keterangan:
IP = indeks pengecoh
P = jumlah peserta didik yang memilih pengecoh
N = jumlah peserta didik yang ikut tes
B = jumlah peserta didik yang menjawab benar pada setiap soal
n = jumlah alternatif jawaban
1 = bilangan tetap
Catatan:
Jika semua peserta didik menjawab benar pada butir soal tertentu (sesuai kunci jawaban),
maka IP = 0 yang berarti soal tersebut jelek. Dengan demikian pengecoh tidak berfungsi.
Contoh:
50 orang peserta didik dites dengan 10 soal bentuk pilihan ganda. Tiap soal memiliki
alternatif jawaban (a, b, c, d, e). Kunci jawaban (jawaban yang benar) no. 8 adalah c.
Setelah soal no.8 diperiksa untuk semua peserta didik, ternyata dari 50 orang peserta
didik, 20 peserta didik menjawab benar dan 30 peserta didik menjawab salah. Idealnya,
pengecoh dipilih secara merata.
Berikut ini adalah contoh soal no.8.
Alternatif jawaban A B C D E
Distribusi jawaban
7 8 20 7 8
peserta didik
IP 93% 107% ** 93% 107%
Kualitas pengecoh ++ ++ ++ ++ ++
Keterangan:
** = kunci jawaban
++ = sangat baik
+ = baik
 = kurang baik
_ = jelek
_ _ = sangat jelek
Pada contoh diatas, IP butir a, b, c, d, dan e adalah 93%, 107%, 93%, dan 107%.
Semuanya dekat dengan angka 100%, sehingga digolongkan sangat baik sebab semua
pengecoh itu berfungsi. Jika pilihan jawaban peserta didik menumpuk pada satu alternatif
jawaban, misalnya seperti berikut:
Alternatif jawaban A B C D E
Distribusi jawaban peserta didik 20 2 20 8 0
IP 267% 27% ** 107% 0%
Kualitas pengecoh _ - ** ++ _

Dengan demikian, dapat ditafsirkan pengecoh (d) yang terbaik, pengecoh (e) dan
(b) tidak berfungsi, pengecoh (a) menyesatkan, maka pengecoh (a) dan (e) perlu diganti
karena termasuk jelek, dan pengecoh (b) perlu direvisi karena kurang baik. adapun
kualitas pengecoh berdasar indeks pengecoh adalah:
Sangat baik IP = 76% - 125%
Baik IP = 51% - 75% atau 126% - 150%
Kurang baik IP = 26% - 50% atau 151% - 175%
Jelek IP = 0% - 25% atau 176% - 200%
Sangat jelek IP = lebih dari 200%
Hasil diskusi

Beberapa hal yang perlu diperhatikan dalam memperbaiki butir soal adalah sebagai berikut:

1. Perhatikan tingkat kesukaran butir soal. Butir soal dianggap baik jika mempunyai indeks
tingkat kesukaran (P) antara 0,25 sampai dengan 0,75 atau yang mendekati angka
tersebut.
2. Perhatikan daya pembeda butir soal. Butir soal dianggap baik jika kunci (jawaban soal)
mempunyai indeks daya pembeda positif tinggi dan pengecohnya mempunyai indeks
daya pembeda negatif.
3. Perhatikan stem atau pokok soalnya sebab stem yang ambigius akan membingungkan
peserta ujian untuk menentukan jawabannya.

Ada beberapa teknik yang dapat digunakan untuk menganalisis butir soal secara kualitatif,
diantaranya adalah teknik moderator dan teknik panel.

Teknik moderator merupakan teknik berdiskusi yang di dalamnya terdapat satu orang
sebagai penengah. Berdasarkan teknik ini, setiap butir soal didiskusikan secara bersama-sama
dengan beberapa ahli seperti guru yang mengajarkan materi, ahli materi, penyusun/pengembang
kurikulum, ahli penilaian, ahli bahasa, berlatar belakang psikologi. Teknik ini sangat baik karena
setiap butir soal dilihat secara bersama-sama berdasarkan kaidah penulisannya. Di samping itu,
para penelaah dipersilakan mengomentari/memperbaiki berdasarkan ilmu yang dimilikinya.
Setiap komentar/masukan dari peserta diskusi dicatat oleh notulis. Setiap butir soal dapat
dituntaskan secara bersama-sama, perbaikannya seperti apa. Namun, kelemahan teknik ini
adalah memerlukan waktu lama untuk rnendiskusikan setiap satu butir soal.

Teknik panel merupakan suatu teknik menelaah butir soal yang setiap butir soalnya ditelaah
berdasarkan kaidah penulisan butir soal, yaitu ditelaah dari segi materi, konstruksi,
bahasa/budaya, kebenaran kunci jawaban/pedoman penskorannya yang dilakukan oleh beberapa
penelaah. Caranya adalah beberapa penelaah diberikan: butir-butir soal yang akan ditelaah,
format penelaahan, dan pedoman penilaian/ penelaahannya.
Format Penelaahan Butir Soal Bentuk Uraian
FORMAT PENELAAHAN BUTIR SOAL BENTUK URAIAN

Mata Pelajaran : .................................


Kelas/semester : .................................
Penelaah : .................................

Nomor Soal
1 2 3 4 5 6 7 8 9 …
No. Aspek yang ditelaah
A. Materi
1 Soal sesuai dengan indikator (menuntut tes tertulis
untuk bentuk Uraian) Batasan pertanyaan dan
2 jawaban yang diharapkan sudah sesuai
Materi yang ditanyakan sesuai dengan kompetensi
3 (urgensi, relevasi, kontinyuitas, keterpakaian sehari-
hari tinggi)
Isi materi yang ditanyakan sesuai dengan jenjang
jenis sekolah atau tingkat kelas
4
Konstruksi
Menggunakan kata tanya atau perintah yang menuntut
jawaban uraian
B Ada petunjuk yang jelas tentang cara mengerjakan
5 soal
Ada pedoman penskorannya
6 Tabel, gambar, grafik, peta, atau

7
8
Nomor Soal
1 2 3 4 5 6 7 8 9 …
No. Aspek yang ditelaah
yang sejenisnya disajikan dengan jelas dan
terbaca
C. Bahasa/Budaya
9 Rumusan kalimat coal komunikatif
10 Butir soal menggunakan bahasa
Indonesia yang baku
11 Tidak menggunakan kata/ungkapan yang
menimbulkan penafsiran ganda atau salah
pengertian
12 Tidak menggunakan bahasa yang berlaku
Keterangan: Berilah tanda (V) bila tidak sesuai dengan aspek yang ditelaah!
setempat/tabu
13 Rumusan soal tidak mengandung
Langkah-Langkah dalam Penyusunan Tes :
Tentu saja setiap guru akan dengan mudah mengatakan bagian pelajaran mana yang
akan dicakup dalam sebuah tes jika sudah diketahui tujuanya.
Urutan langkah yang dilakukan adalah:
1. Menentukan tujuan mengadakan tes.
2. Mengadakan pembatasan terhadap bahan yang akan diteskan.
3. Merumuskan tujuan intruksional khusus dari tiap bagian bahan.
4. Menderetkan semua TIK dalam tabel persiapan yang memuat pula aspek tingkah laku
terkandug dalam TIK itu. Tabel ini digunakan untuk mengadakan identifikasi terhadap
tingkah laku yang dikehendaki, agar tidak terlewati.
Contoh :
Tabel TIK dan aspek tingkah laku yang dicakup :
No TIK Aspek Tingkah Ingatan Pemahaman Aplikasi Keterangan
Laku
1 Ssiswa dapat menjumlah
2 bilangan bersusun. ü ü
2 Siswa dapat merangkum
hukum komulatif dan ü ü
seterusnya

1. Menyusun tabel spesifikasi yang memuat pokok materi, aspek berpikir yang diukur
beserta imbangan antara kedua hal tersebut.
2. Menuliskan butir-butir soal, didasarkan atas TIK-TIK yang sudah di tuliskan pada tabel
TIK dan aspek tingkah laku yang dicakup.

Banyak faktor yang dapat mempengaruhi hasil tes evaluasi tidak valid. Beberapa faktor
tersebut secara garis besar dapat dibedakan menurut sumbernya, yaitu faktor internal dari tes,
faktor eksternal tes, dan faktor yang berasal dari siswa yang bersangkutan :

1. Faktor yang berasal dari dalam tes


a. Arahan tes yang disusun dengan makna tidak jelas sehingga dapat mengurangi
validitas tes
b. Kata-kata yang digunakan dalam struktur instrument evaluasi, tidak terlalu sulit
c. Item tes dikonstruksi dengan jelas.
d. Tingkat kesulitan item tes tidak tepat dengan materi pembelajaran yang diterima
siswa.
e. Waktu yang dialokasikan tidak tepat, hal ini termasuk kemungkinan terlalu kurang
atau terlalu longgar.
f. Jumlah item terlalu sedikit sehingga tidak mewakili sampel
g. Jawaban masing-masing item evaluasi bisa diprediksi siswa
2. Faktor yang berasal dari administrasi dan skor tes.
a. Waktu pengerjaan tidak cukup sehingga siswa dalam memberikan jawaban dalam
situasi tergesa-gesa.
b. Adanya kecrangan dalam tes sehingga tidak membedakan antara siswa yang
belajar dengan melakukan kecurangan.
c. Pemberian petunjuk dari dari pengawas yang tidak dapat dilakukan pada semua
siswa.
d. Teknik pemberian skor yang tidak konsisten.
e. Siswa tidak dapat memngikuti arahan yang diberikan dalam tes baku.
f. Adanya joki (orang lain bukan siswa) yang masuk dalam menjawab item tes yang
diberikan.
3. Faktor yang berasal dari jawaban siswa
Seringkali terjadi bahwa interpretasi terhadap item-item tes evaluasi tidak
valid, karena dipengaruhi oleh jawaban siswa dari pada interpretasi item-item pada tes
evaluasi (Sukardi, 2008).

Salah satu upaya dalam meningkatkan kualitas proses dan hasil belajar sebagai bagian
dari peningkatan kualitas pendidikan dapat dilakukan melalui sistem penilaian. Dalam
penilaian proses dan hasil belajar siswa di sekolah, guru memberikan suatu evaluasi untuk
mengetahui sejauh mana penguasaan materi yang telah dikuasai oleh siswa selama proses
belajar mengajar mengenai materi yang disampaikan. Dalam melaksanakan kegiatan
evaluasi, berhasil atau tidaknya sangat ditentukan oleh tepat atau tidaknya pelaksanaan ujian.
Untuk melaksanakan ujian ini memerlukan alat-alat. Bagi ujian tertulis maka alatnya adalah
butir-butir soal tertulis. Bagi ujian lisan maka alatnya adalah butir soal tertulis yang
disediakan bagi setiap testi, atau sekurang-kurangnya pokok pertanyaan yang sudah tertulis
dan dipersiapkan sebelumnya. Bagi ujian praktek, maka alatnya adalah lembar pengamatan
yang berisi segi-segi yang diamati beserta rentang skor masing-masing. Idealnya sebelum
suatu tes dipergunakan maka tes tersebut harus memenuhi syarat-syarat sebagi tes yang baik,
maka tes yang bersangkutan perlu diuji cobakan. Namun sebelum diuji cobakan tes tersebut
harus memperlihatkan indokator-indikator sebagai tes yang baik. Dalam hal ini dilakukan
suatu analisis butir soal.
Tes yang baik harus memiliki beberapa criteria diantaranya harus valid, reliable,
punya daya pembeda, punya daya pengecoh dan dan memperhatikan tingkat kesukaran. Hasil
tes perlu dilakukan analisis butir soal untuk memperbaiki kualitas tes yang akan digunakan
untuk masa yang akan datang.
PENUTUP

Menganalisis butir soal merupakan suatu kegiatan yang harus dilakukan guru untuk
meningkatkan mutu soal yang dibuat. Analisis butir soal dapat dilakukan secara kualitatif dan
kuantitatif. Kriteria kualitas butir soal dapat ditentukan dengan cara validitas dan realibilitas.
Tujuan analisis soal yaitu untuk mengkaji dan menelaah setiap butir soal agar diperoleh soal
yang bermutu, sedangkan manfaatnya dapat membantu pengguna tes dalam mengevaluasi
kualitas tes yang digunakan. Dalam menganalisis butir soal harus diperhatikan tingkat
kesukarannya karena butir soal yang terlalu sukar atau terlalu mudah tidak banyak memberi
informasi tentang butir soal atau peserta tes. Ada beberapa teknik yang dapat digunakan
untuk menganalisis butir soal secara kualitatif, diantaranya adalah teknik moderator dan
teknik panel.
DAFTAR PUSTAKA

Yusuf Muri, 2014. Metode Penelitian: Kuantitatif, Kualitatif, dan Penelitian Gabungan.
Jakarta: KENCANA
Tobari, 2015. Evaluasi Soal-soal Penerimaan Pegawai Baru.Sleman: CV BUDI UTAMA.
Farida Ida, 2017. Evaluasi Pebelajaran. Bandung: PT Remaja Rosdakarya.
Internet Online: https://www.amongguru.com/download-aplikasi-analisis-butir-soal-bentuk-
pilihan-ganda-dan-uraian/
Internet Online:
http://staffnew.uny.ac.id/upload/132231727/pendidikan/22.+Materi+Kuliah+Evaluasi+Pembe
lajaran.pdf

Você também pode gostar