Escolar Documentos
Profissional Documentos
Cultura Documentos
KATA PENGANTAR
Puji syukur penulis panjatkan kepada Tuhan Yang Maha Esa atas segala nikmat yang
telah diberikan sehingga penulis dapat menyelesaikan makalah ini tepat pada waktunya.
Makalah ini dibuat untuk memenuhi tugas mata kuliah Evaluasi Hasil Belajar dengan
judul Analisis Butir Soal. Harapan kami semoga makalah ini bisa memberikan manfaat bagi para
pembaca. Sehingga dengan Makalah Tentang Analisis Butir Soal ini kita bisa memberikan
sedikit ilmu dan pengetahuan pada para pembaca.
Kami menyadari sepenuhnya bahwa makalah ini masih jauh dari sempurna, untuk itu
kami mengharapkan kritik dan saran yang membangun dari pembaca agar menjadi lebih baik di
masa yang akan datang.
Penulis
DAFTAR ISI
KATA PENGANTAR............................................................................................ ii
DAFTAR PUSTAKA
BAB I
PENDAHULUAN
B. Rumusan Masalah
Dari uraian latar belakang di atas maka dapat kita rumuskan masalah sebagai berikut:
1. Apa pengertian analisis butir soal?
2. Apa Tujuannya?
3. Bagaimana penganalisisan terhadap butir soal?
C. Tujuan Penulisan
1. Mengetahui pengertian analisis butir soal
2. Mengetahui tujuan penganalisisan
3. Mengetahui bagaimana penganalisisan terhadap butir soal
BAB II
PEMBAHASAN
B. Tujuan Analisis
Analisis butir tes merupakan kegiatan penting dalam upaya memperoleh instrument
yang berkategori baik. Analisis ini meliputi:
1. Menentukan validitas dan reliabilitas tes, dan
2. Analisis butir tes.
Menurut Thorndike & Hagen, analisis terhadap butir tes yang telah dijawab siswa
suatu kelas mempunyai dua tujuan, yakni:
1. Jawaban-jawaban soal-soal tersebut merupakan informasi diagnosis untuk meneliti pelajaran
dari kelas itu dan kegagalan-kegagalan belajarnya, serta selanjutnya untuk membimbing kea rah
cara belajar yang baik, dan
2. Jawaban terhadap soal-soal dan perbaikan soal-soal yang didasarkan atas jawaban-jawaban
tersebut merupakan dasar bagi penyiapan tes-tes yang lebih baik.
Analisis butir tes bertujuan untuk mengidentifikasi butir-butir manakah yang
termasuk dalam kategori baik, kurang baik, dan jelek. Analisis butir tes memungkinkan kita
memperoleh informasi mengenai baik tidaknya suatu butir, sekaligus memperoleh petunjuk
untuk melakukan perbaikan. Dengan melakukan analisis butir setidaknya kita dapat mengetahui
empat hal penting, yaitu:
1. Bagaimana taraf kesukaran setiap butir tes?
2. Apakah setiap soal memiliki daya pembeda baik?
3. Apakah semua alternative jawaban dapat berfungsi secara baik?
4. Sejauh mana tiap butir tes dapat mengukur hasil pembelajaran?
Soal dikatakan baik apabila soal tersebut tidak terlalu sukar atau terlalu mudah. Soal
yang terlalu mudah, yakni semua anak dapat mengerjakan dengan benar, adalah tidak baik.
Demikian juga soal yang terlalu sukar, yaitu semua anak tidak dapat mengerjakan soal dengan
benar, juga merupakan soal yang tidak baik. Hal itu disebabkan karena soal yang terlalu mudah
tidak merangsang peserta didik untuk mempertinggi usaha memecahkannya. Dan soal yang
terlalu sukar menyebabkan peserta didik putus asa serta menjadi tidak mempunyai semangat
untuk mencoba lagi karena diluar jangkauannya.
Ada beberapa dasar pertimbangan dalam menentukan proporsi jumlah soal kategori
mudah, sedang, dan sukar. Pertimbangan pertama adalah adanya keseimbangan, yakni jumlah
soal sama untuk ketiga kategori tersebut. Artinya, soal mudah, sedang, dan sukar jumlahnya
seimbang. Persoalan lain adalah menentukan kriteria soal, yaitu ukuran untuk menentukan
apakah soal tersebut termasuk mudah, sedang atau sukar. Dalam menentukan kriteria ini
digunakan judgment dari guru berdasarkan pertimbangan-pertimbangan tertentu. Pertimbangan
tersebut antara lain adalah :
a. Abilitas yang diukur dalam pertanyaan tersebut
b. Sifat materi yang diujikan atau ditanyakan
c. Isi bahan yang ditanyakan sesuai dengan bidang keilmuannya, baik luasnya maupun
kedalamannya
d. Bentuk soal
Dalam kaitannya dengan hasil analisis item dari segi derajat kesukarannya seperti
telah dikemukakan di atas, maka tindak lanjut yang perlu dikemukakan oleh tester adalah sebagai
berikut:
Pertama, untuk butir-butir item yang berdasarkan hasil analisis termasuk dalam
kategori baik (dalam arti derajat kesukaran itemnya cukup atau sedang), seyogyanya butir item
tersebut segera dicatat dalam buku bank soal.
Kedua, untuk butir-butir item yang termasuk dalam kategori terlalu sukar, ada tiga
kemungkinan tindak lanjut, (1) butir soal tersebut dibuang/didrop, (2) diteliti ulang, dilacak dan
ditelusuri sehingga dapat diketahui faktor yang menyebabkan butir item yang bersangkutan sulit
dijawab oleh testee, (3) Haruslah dipahami bahwa tidak setiap butir item yang termasuk dalam
kategori terlalu sukar itu sama sekali tidak memiliki kegunaan.
Ketiga, untuk butir-butir item yang termasuk dalam kategori terlalu mudah, juga ada
tiga kemungkinan tindak lanjutnya. Yaitu (1) butir soal tersebut dibuang/didrop, (2) diteliti
ulang, dilacak dan ditelusuri sehingga dapat diketahui faktor yang menyebabkan butir item yang
bersangkutan mudah dijawab oleh testee, (3) Seperti halnya butir-butir yang terlalu sukar, butir-
butir item yang terlalu mudah juga masih mengandung manfaat, yaitu bahwa butir-butir item
yang termasuk dalam kategori ini dapat dimanfaatkan pada tes-tes (terutama tes seleksi) yang
sifatnya longgar.
Tes dikatakan tidak memiliki daya pembeda apabila tes tersebut, jika diujikan kepada
anak berprestasi tinggi, hasilnya rendah tetapi bila diberikan kepada anak yang lemah hasilnya
lebih tinggi. Atau bila diberikan kepada kedua kategori siswa tersebut hasilnya sama saja.
Dengan demikian, tes yang tidak memiliki daya pembeda, tidak akan menghasilkan
gambaran hasil yang sesuai dengan kemampuan siswa yang sebenarnya. Akan terlihat aneh
apabila anak pandai tidak lulus tetapi anak bodoh lulus dengan baik tanpa dilakukan manipulasi
oleh tester (si penilai) atau di luar faktor kebetulan.
Angka yang menunjukkan besarnya daya pembeda disebut indeks daya pembeda
(item discrimination) disingkat D (d besar). Indeks daya pembeda didefinisikan sebagai selisih
antara proporsi jawaban benar pada kelompok atas (peserta didik tes yang mampu/pandai)
dengan proporsi jawaban benar pada kelompok bawah (peserta didik tes yang kurang
mampu/pandai). Umumnya, para ahli tes membagi kelompok ini menjadi 27% atau 33%
kelompok atas dan 27% atau 33% kelompok bawah (Cureton, 1957).
Contoh: Pembagian Kelompok 27%
Responden SKOR BUTIR SOAL SETIAP NOMOR SOAL Total Skor
1 2 3 4 5 6 7 8 9 10
1 1 1 1 1 0 1 1 1 1 1 9
2 1 1 1 1 1 0 1 1 1 1 9
3 1 1 1 1 1 1 0 0 1 1 8
4 1 1 0 1 1 1 0 1 1 0 7
5 0 1 1 1 1 1 0 1 0 1 7
6 0 1 1 1 1 1 0 1 1 0 7
7 1 0 1 0 1 1 0 1 0 1 6
8 1 1 1 1 1 0 0 1 0 0 6
9 0 1 1 1 1 0 0 0 1 1 6
10 0 1 0 1 1 1 0 0 1 1 6
11 0 1 0 1 1 1 0 1 0 1 6
12 0 1 1 0 1 1 0 1 0 0 5
13 1 1 0 1 0 1 1 0 0 0 5
14 0 0 1 0 1 0 0 1 1 1 5
15 0 1 0 1 0 1 0 1 1 0 5
16 1 1 0 1 0 1 0 0 0 1 5
17 1 0 0 1 0 1 0 1 0 1 5
18 0 0 1 0 0 1 0 1 0 1 4
19 1 0 1 0 0 0 0 1 0 0 3
20 0 0 1 0 1 0 0 0 1 0 3
Indeks daya pembeda berkisar antara -1,00 sampai 1,00. Tanda negatif menunjukkan
bahwa peserta didik tes yang kemampuannya rendah dapat menjawab benar sedangkan peserta
didik tes yang kemampuannya tinggi menjawab salah. Dengan demikian, soal yang indeks daya
pembedanya negatif menunjukkan terbaliknya kualitas peserta didik tes. Indeks daya pembeda
dapat dicari dengan menggunakan rumus sebagai berikut ini.
D = indeks daya pembeda
A = jumlah peserta didik tes yang menjawab benar pada kelompok atas
B = jumlah peserta didik tes yang menjawab benar pada kelompok bawah
nA = jumlah peserta didik tes kelompok atas
nB = jumlah peserta didik tes kelompok bawah
Pada kebanyakan kasus, jumlah peserta didik tes kelompok atas sama dengan jumlah
peserta didik tes kelompok bawah, nA = nB = n. Dengan demikian maka rumus daya pembeda
menjadi:
Kriteria indeks daya pembeda berdasarkan Crocker dan Algina (1986) adalah sebagai
berikut :
Daya Pembeda Kualifikasi
0,00 – 0,19 soal tidak dipakai/dibuang
0,20 – 0,29 soal diperbaiki
0,30 – 0,39 soal diterima tapi perlu diperbaiki
0,40 – 1,00 soal diterima/baik
Contoh:
Tingkat Kesukaran 27% kelompok atas (5 orang dari 20 peserta didik tes)
Responden SKOR BUTIR SOAL SETIAP NOMOR SOAL Total
1 2 3 4 5 6 7 8 9 10 Skor
1 1 1 1 1 0 1 1 1 1 1 9
2 1 1 1 1 1 0 1 1 1 1 9
3 1 1 1 1 1 1 0 0 1 1 8
4 1 1 0 1 1 1 0 1 1 0 7
5 0 1 1 1 1 1 0 1 0 1 7
Xatas 4 5 4 5 4 4 2 4 4 4
Skor maks 1 1 1 1 1 1 1 1 1 1
Kel. Atas 5 5 5 5 5 5 5 5 5 5
(P) kel. Atas 0.8 1.0 0.8 1.0 0.8 0.8 0.4 0.8 0.8 0.8
Tingkat Kesukaran 27% kelompok bawah (5 orang dari 20 peserta didik tes)
Responden SKOR BUTIR SOAL SETIAP NOMOR SOAL Total
1 2 3 4 5 6 7 8 9 10 Skor
16 1 1 0 1 0 1 0 0 0 1 5
17 1 0 0 1 0 1 0 1 0 1 5
18 0 0 1 0 0 1 0 1 0 1 4
19 1 0 1 0 0 0 0 1 0 0 3
20 0 0 1 0 1 0 0 0 1 0 3
Xatas 3 1 3 2 1 3 0 3 1 3
Skor maks 1 1 1 1 1 1 1 1 1 1
Kel. Bawah 5 5 5 5 5 5 5 5 5 5
(P) kel. bawah 0.6 0.2 0.6 0.4 0.2 0.6 0 0.6 0.2 0.6
Untuk mengetahui besar kecilnya angka indeks diskriminasi item dapat dipergunakan
rumus berikut ini:
D = Discriminatory power (angka indeks diskriminasi item)
PA = Proporsi testee kelompok atas yang dapat menjawab dengan betul butir item yang bersangkutan
PB = Proporsi testee kelompok bawah yang dapat menjawab dengan betul butir item yang
bersangkutan
Tabel berikut menunjukkan daya pembeda soal nomor 1 sampai dengan nomor 10
berdasarkan perbedaan 27% kelompok atas dan 27% kelompok bawah.
Daya Pembeda Soal
Soal Tingkat kesukaran Tingkat kesukaran Daya pembeda Soal (D)
kelompok atas kelompok bawah
1 0.80 0.60 0.20
2 1.00 0.20 0.80
3 0.80 0.60 0.20
4 1.00 0.40 0.60
5 0.80 0.20 0.60
6 0.80 0.60 0.20
7 0.40 0 0.40
8 0.80 0.60 0.20
9 0.80 0.20 0.60
10 0.80 0.60 0.20
Soal nomor 1, 3, 6, 8, dan 10 berdaya pembeda 0.20. Hal ini berarti kelompok lima
soal tersebut mempunyai kualifikasi soal yang harus diperbaiki. Hal ini sesuai dengan
pengklasifikasian daya pembeda oleh Crocker dan Algina yang telah dijelaskan di atas.
Dalam hubungan ini, patokan yang pada umumnya dipegangi adalah sebagai berikut:
Besarnya Angka Indeks
Klasifikasi Interpretasi
Diskriminasi Item
Butir item yang bersangkutan daya
pembedanya lemah sekali (jelek),
Kurang dari 0,20 Poor
dianggap tidak memiliki daya pembeda
yang baik
Butir yang bersangkutan telah memiliki
0,20-0,40 Satisfactory
daya pembeda yang cukup (sedang)
Butir yang bersangkutan telah memiliki
0,40-0,70 Good
daya pembeda yang baik
Butir item yang bersangkutan telah
0,70-1,00 Excellent memiliki daya pembeda yang baik
sekali
Butir item yang bersangkutan daya
Bertanda negatif -
pembedanya negative (jelek sekali)