Você está na página 1de 13

ANALISIS BUTIR SOAL UJIAN AKHIR BERSTANDAR NASIONAL

(UASBN) IPA SMP TAHUN AJARAN 2017/2018


DI KABUPATEN “X” PROVINSI BANTEN

Indrie Prihastuti
Lembaga Penjaminan Mutu Pendidikan Provinsi Banten, Jl. Siliwangi No. 208
Rangkasbitung, Banten, 42313, Indonesia

arifinindrie@gmail.com

Abstrak. Studi ini bertujuan untuk mengetahui kualitas butir soal pada naskah soal USBN
mata pelajaran IPA SMP. Soal yang dianalisis adalah soal pilihan ganda sebanyak 35 soal
dengan empat pilihan jawaban. 27 soal merupakan hasil pengembangan soal yang dilakukan
oleh MGMP IPA Kabupaten X, sedangkan 8 soal lainnya merupakan soal yang dibuat oleh
pemerintah melalui Pusat Penilaian Pendidikan (Puspendik). Analisis dilakukan dengan
menggunakan 2 pendekatan yaitu pendekatan teori klasik dan modern. Analisis dengan teori
klasik menggunakan program ITEMAN, sedangkan analisis teori modern menggunakan model
1 parameter yang diolah dengan program ACER Conquest 2.0. 1. Berdasarkan analisis
menggunakan pendekatan teori klasik menunjukkan : 47% soal termasuk kategori sukar dan
53% termasuk kategori sedang; terdapat 11 soal (31%) soal yang perlu di revisi berdasarkan
daya pembeda; hanya 2 opsi pengecoh yang kurang berfungsi dengan baik; reliabilitas
instrument termasuk dalam kategori sedang. Hasil analisis dengan pendekatan teori modern
menunjukkan : 35 butir soal cocok ke dalam model Rasch; 11 soal termasuk kategori sangat
sukar; sebagian besar kemampuan responden/siswa berada terhadap soal USBN mata pelajaran
IPA masih dibawah skala 0 logits.

1. Latar Belakang
Salah satu teknik penilaian yang sering digunakan adalah tes. Tes adalah merupakan alat
atau prosedur yang digunakan untuk mengetahui atau mengukur sesuatu dalam suasana,
dengan cara dan aturan-aturan yang sudah ditemukakan (Arikunto, 2009). Agar menghasilkan
alat tes yang baik perlu di uji coba dan dianalisis hasilnya untuk melihat kriterianya. Kegiatan
menganalisis butir soal merupakan suatu kegiatan yang harus dilakukan guru untuk
meningkatkan mutu soal yang telah ditulis. Soal yang bermutu adalah soal yang dapat
memberikan informasi setepat-tepatnya sesuai dengan tujuannya di antaranya dapat
menentukan peserta didik mana yang sudah atau belum menguasai materi yang diajarkan
guru. Butir soal yang disusun harus mencakup seluruh kurikulum, diharapkan kompetensi
dasar dan standar kompetensinya dapat tercapai. Setiap butir soal hendaknya memiliki
validitas isi, artinya alat ukur tersebut memang benar–benar berisi materi yang akan diukur.
Sehingga kesesuaian antara alat ukur dengan isi yang seharusnya diukur benar–benar
ditampilkan dalam penyusunan soal.
Pada kenyataannya guru jarang sekali melakukan uji coba terhadap soal yang akan
digunakan termasuk juga menganalisis kualitas dari setiap butir soal yang akan diujikan
sehingga kebanyakan belum bisa mengidentifikasi soal-soal yang baik, kurang baik, dan soal
yang jelek. Hasil penelitian T.D Rahayu dkk (2014) menunjukkan tingkat kesukaran soal
pilihan ganda buatan guru belum proporsional dan ada yang tidak sesuai antara ranah kognitif
yang ditetapkan oleh guru dengan ranah kognitif yang sebenarnya menurut taksonomi Bloom.
Daya beda soal pilihan ganda buatan guru tersebut masih rendah. Hasi penelitian Rofiqoh
pada tahun 2011 pada soal ujian mata pelajaran Fisika menunjukkan tingkat kesukaran butir
soal dalam kategori mudah 100%. Artinya soal dapat dikatakan tidak baik karena terlalu
mudah. Daya pembeda butir soal dalam kategori baik sebanyak 4 butir (10,00%), cukup
sebanyak 10 butir (25,00%), jelek sebanyak 25 butir (62,50%), dan dibuang sebanyak 1 butir
(2,50%). Artinya soal tidak dapat membedakan siswa yang pandai dan kurang pandai.
Berdasarkan latar belakang di atas, makalah ini disusun untuk menganalisis butir soal yang
digunakan dalam ujian sekolah berstandar nasional (USBN) pada mata pelajaran IPA. USBN
merupakan proses penilaian akhir pada siswa SMP yang akan menentukan proses kelulusan.
Sebelumnya, UN atau ujian nasional adalah sistem ujian yang diterapkan oleh pemerintah
pusat untuk menentukan kelulusan peserta didik dari satu jenjang pendidikan tertentu
termasuk SMP. Soal-soal UN dibuat oleh pemerintah pusat melalui Kementerian Pendidikan
dan Kebudayaan. Namun saat ini peran tersebut digantikan oleh USBN yang mayoritas soal-
soalnya disusun oleh kelompok guru mata pelajaran pada setiap kabupaten atau kota. Adapun
skema USBN pada tahun ini, 75% soal disusun oleh guru dengan 25% jangkar soal dari
Kemdikbud. Peran guru dalam membuat soal-soal ini amat penting, karena soal-soal ini
menjadi penentu pencapaian hasil belajar dan kemampuan siswa. Oleh karena itu perlu
dilakukan analasis butir soal untuk melihat gambaran kualitas butir soal yang telah disusun
guru-guru tersebut. Analisis butir soal akan difokuskan kepada analisis secara kuantitatif.
Hasil analisis mencakup reliabilitas soal, tingkat kesukaran soal, daya beda soal, model-fit
dan penyebaran kemampuan siswa dibandingkan dengan tingkat kesukaran soal.

2. Dasar Teori
Aspek yang perlu diperhatikan dalam analisis butir soal secara klasik adalah setiap butir
soal ditelaah dari segi: tingkat kesukaran butir, daya pembeda butir, dan penyebaran pilihan
jawaban (untuk soal bentuk obyektif) atau frekuensi jawaban pada setiap pilihan jawaban
atau efektifitas pengecoh. Kelebihan analisis butir soal secara klasik adalah murah, dapat
dilaksanakan sehari-hari dengan cepat menggunakan komputer, sederhana, dan dapat
menggunakan data dari beberapa peserta didik atau sampel kecil. Kelebihan ini dapat
memudahkan guru untuk melakukan analisis.
Tingkat kesukaran merupakan alat ukur yang digunakan untuk mengetahui mudah atau
sukarnya suatu soal yang biasanya dinyatakan dalam bentuk indeks (difficulty index). Tingkat
kesukaran diperoleh dari menghitung persentase siswa yang dapat menjawab benar soal
tersebut. Semakin banyak siswa yang dapat menjawab benar suatu soal semakin mudah soal
itu. Sebaliknya, semakin banyak siswa yang tidak dapat menjawab suatu soal maka semakin
sukar soal itu.
Daya pembeda soal adalah kemampuan suatu butir soal dapat membedakan antara siswa
yang telah menguasai materi yang ditanyakan dan siswa yang tidak/kurang/belum menguasai
materi yang ditanyakan. Angka yang menunjukkan besarnya daya pembeda disebut indeks
daya beda. Indeks daya pembeda berkisar antara -1,00 sampai dengan +1,00. Semakin tinggi
daya pembeda suatu soal, maka semakin kuat/baik soal itu. Jika daya pembeda negatif (<0)
berarti lebih banyak kelompok bawah (warga belajar/peserta didik yang tidak memahami
materi) menjawab benar soal dibanding dengan kelompok atas (warga belajar/peserta didik
yang memahami materi yang diajarkan guru).
Berfungsi tidaknya jawaban yang tersedia dalam soal pilihan ganda dapat diketahui
dengan menganalisis distribusi jawaban. Pengecoh atau opsi yang diberikan dapat menjadi
pilihan bagi siswa ketika melakukan proses penyelesaian soal. Opsi yang menjadi pengecoh
dicantumkan dalam pembuatan soal harus karena salah konsep, salah hitung, atau salah
prosedur. Sebuah pengecoh dapat dikatakan berfungsi dengan baik apabila pengecoh tersebut
mempunyai daya tarik yang besar bagi peserta tes yang kurang memahami konsep atau
kurang menguasai materi. Jadi, pengecoh harus diperhatikan dalam pembuatan opsi sehingga
dapat berfungsi dengan baik.
Adapun keterbatasan dari penggunaan teori tes klasik dalam analisis butir soal adalah
(Hambleton, 1993): (1) Tingkat kemampuan dalam teori klasik adalah "true score". Jika tes
sulit artinya tingkat kemampuan peserta didik mudah. Jika tes mudah artinya tingkat
kemampuan peserta didik tinggi. (2) Tingkat kesukaran soal didefinisikan sebagai proporsi
peserta didik dalam grup yang menjawab benar soal. Mudah/sulitnya butir soal tergantung
pada kemampuan peserta didik yang dites dan kemampuan tes yang diberikan. (3) Daya
pembeda, reliabilitas, dan validitas soal/tes didefinisikan berdasarkan grup peserta didik.
Berdasarkan kekurangan tersebut maka munculah analisis butir soal berdasarkan teori
modern yang berusaha mengurangi/menutupi kelemahan dari teori tes klasik.
Analisis butir soal secara modern yaitu penelaahan butir soal dengan menggunakan Item
Response Theory (IRT) atau teori jawaban butir soal. Teori ini merupakan suatu teori yang
menggunakan fungsi matematika untuk menghubungkan antara peluang menjawab benar
suatu scal dengan kemampuan siswa. Adapun kelebihan IRT adalah bahwa: (1) IRT tidak
berdasarkan grup dependent, (2) skor siswa dideskripsikan bukan test dependent, (3) model
ini menekankan pada tingkat butir soal bukan tes, (4) IRT tidak memerlukan paralel tes untuk
menentukan relilabilitas tes, (5) IRT suatu model yang memerlukan suatu pengukuran
ketepatan untuk setiap skor tingkat kemampuan.
Ada tiga keuntungan IRT adalah: (1) asumsi banyak soal yang diukur pada trait yang
sama, perkiraan tingkat kemampuan peserta didik adalah independen; (2) asumsi pada
populasi tingkat kesukaran, daya pembeda merupakan independen sampel yang
menggambarkan untuk tujuan kalibrasi soal; (3) statistik yang digunakan untuk menghitung
tingkat kemampuan siswa diperkirakan dapat terlaksana, (Hambleton, 1993). Jadi IRT
merupakan hubungan antara probabilitas jawaban suatu butir soal yang benar dan
kemampuan siswa atau tingkatan/level prestasi siswa.
Ada empat macam model 1RT (Hambleton, 1993) yaitu: (1) Model satu parameter (Model
Rasch), yaitu untuk menganalisis data yang hanya menitikberatkan pada parameter tingkat
kesukaran coal. (2) Model dua paremeter, yaitu untuk menganalisis data yang hanya
menitikberatkan pada parameter tingkat kesukaran dan daya pembeda soal. (3) Model tiga
parameter, yaitu untuk menganalisis data yang menitikberatkan pada parameter tingkat
kesukaran soal, daya pembeda soal, dan menebak (guessing). (4) Model empat parameter,
yaitu untuk menganalisis data yang menitikberatkan pada parameter tingkat kesukaran soal,
daya beda soal, menebak, dan penyebab lain. Dalam pembahasan makalah ini akan
digunakan model 1 parameter atau model Rasch.
Pada model Rasch dilakukan kalibrasi butir soal dan pengukuran kemampuan orang yang
merupakan proses estimasi parameter. Model persamaan dasar Rasch adalah model
probabilistik yang mencakup hasil dari suatu interaksi butir soal-orang. Proses mengestimasi
kemampuan orang dinamakan pengukuran, sedangkan proses mengestimasi parameter tingkat
kesukaran butir soal dinamakan kalibrasi. Jadi kalibrasi soal merupakan proses penyamaan
skala soal yang didasarkan pada tingkat kesukaran butir soal dan tingkat kemampuan siswa.
Adapun ciri suatu skala adalah mempunyai titik awal, biasanya 0, dan mempunyai satuan
ukuran atau unit pengukuran. Tingkat kemampuan testi maupun tingkat kesukaran item
dalam Rasch Model (RM) diekspresikan pada satu garis berupa absis pada grafik dengan
satuan berupa logit (logg-odd unit). Butir yang memiliki tingkat kesukaran dekat atau terletak
di bawah skala 0 menunjukkan bahwa butir tes tersebut termasuk kategori mudah. Butir yang
memiliki tingkat kesukaran dekat atau terletak di atas skala 0 menunjukkan butir tes tersebut
termasuk kategori sukar. Kriteria data sesuai dengan model Rasch adalah pada besarnya nilai
rata-rata Weighted/infit Mean of Square (infit MNSQ) serta kisaran dari nilai t yaitu ±2,0
(pembulatan ±1,96) dengan taraf kesalahan atau alpha sebesar 5%. Hal ini menunjukkan
bahwa butir soal fit atau cocok dengan model Rasch sehingga butir soal dapat diterima.
Prosedur estimasi dapat dilakukan dengan penggunaan software komputer seperti WINSTEP,
BIGSTEP, CONQUEST dan lain-lain.

3. Metode
Analisis soal dilakukan pada naskah soal USBN SMP tahun ajaran 2017/2018 khususnya
mata pelajara IPA. Soal yang dianalisis adalah soal pilihan ganda sebanyak 35 soal dengan
empat pilihan jawaban. Soal disusun oleh tim penyusun soal khusus yang ditunjuk oleh dinas
pendidikan kabupaten setempat. Namun dari 35 soal yang diujikan, 8 soal diantaranya adalah
soal yang dibuat oleh Kemdikbud melalui Pusat Penilaian Pendidikan dan ini berlaku sama
untuk setiap wilayah di seluruh Indonesia. Sedangkan 27 soal lainnya disusun oleh tim
penyusun soal di tingkat kabupaten. Sumber data yang digunakan pada pembahasan makalah
ini adalah hasil jawaban siswa SMP yang berasal dari empat sekolah di Kabupaten X Provinsi
Banten. Analisis dilakukan dengan menggunakan 2 pendekatan yaitu pendekatan teori klasik
dan modern. Analisis dengan teori klasik menggunakan program ITEMAN, sedangkan
analisis teori modern menggunakan model 1 parameter yang diolah dengan program ACER
Conquest 2.0. Dikarenakan keterbatasan data yang dapat diolah dengan program ITEMAN,
maka jumlah responden yang dianalisis hanya sebanya 250 orang. Sedangkan jumlah
responden yang dianalisis dengan mengggunakan ACER Conquest adalah sebanyak 655
orang karena software ini dapat menganalisis lebih dari 3000 data.
Pembahasan dari analisis soal dengan teori klasik mencakup tingkat kesukaran soal, daya
pembeda, efektifitas pengecoh dan reliabilitas tes. Pembahasan analisis soal dengan teori
modern berfokus pada hasil model fit dan peta tingkat kesukaran soal dibandingkan dengan
kemampuan siswa dalam menjawab soal (item-person map).

4. Hasil dan Diskusi

4.1 Hasil Analisis dengan Program ITEMAN


Tingkat Kesukaran
Kriteria interpretasi hasil perhitungan tingkat kesukaran soal (prop. Correct) yaitu P =
0,00 termasuk kategori sangat sukar; 0,00 < P ≤ 0,30 termasuk kategori sukar; 0,30 < P ≤
0,70 termasuk kategori sedang; 0,70 < P ≤ 1,00 termasuk kategori mudah; dan P = 1,00
termasuk kategori soal sangat mudah. Berdasarkan hasil analisis dengan menggunakan
program ITEMAN pada lampiran 1, terdapat 16 butir soal (47%) dalam kategori sukar dan 19
butir soal (53%) dalam kategori sedang. Distribusi dari 35 soal berdasarkan tingkat kesukaran
adalah sebagai berikut:

Tabel 1 Distribusi dan frekuensi tingkat kesukaran pada naskah soal USBN IPA SMP
2017/2018 Kabupaten X
No Kategori Nomor Soal Jumlah Persentase (%)
1 Sukar 3, 4, 7, 9, 10, 14, 15, 16, 17, 20, 22, 26, 28, 16 47
33, 34, 35
2. Sedang 1, 2, 5, 6, 8, 11, 12, 13, 18, 19, 21, 23, 24, 19 53
25, 27, 29, 30, 31, 32

Daya Pembeda
Kriteria interpretasi daya pembeda yaitu DP ≤ 0,00 termasuk kategori sangat jelek; 0,00 <
DP ≤ 0,20 termasuk kategori jelek; 0,20 < DP ≤ 0,40 termasuk kategori cukup; 0,40 < DP ≤
0,70 termasuk kategori baik; dan 0,70 < DP ≤ 1,00 termasuk kategori sangat baik.
Berdasarkan kriteria tersebut hasil analisis menunjukkan 2 butir soal (5%) yang termasuk
kategori sangat jelek, 9 butir soal (26%) termasuk kategori jelek, 23 butir soal (66%)
termasuk kategori cukup dan hanya 1 butir soal (3%) yang termasuk kategori baik. Distribusi
dari 35 soal berdasarkan daya pembeda adalah sebagai berikut:
Tabel 2 Distribusi dan frekuensi daya pembeda pada naskah soal USBN IPA SMP 2017/2018
Kabupaten X
No Kategori Nomor Soal Jumlah Persentase (%)
1 Sangat jelek 3, 22 2 5
2. Jelek 6, 10, 14, 17, 24, 29, 31, 33, 35 9 26
3. Cukup 1, 2, 4, 5, 7, 8, 9, 11, 12, 13, 15, 16, 18, 20, 23 66
21, 23, 25, 26, 27, 28, 30, 32, 34
4. Baik 19 1 3

Berdasarkan hasil di atas, butir soal yang dapat diterima berdasarkan daya pembeda adalah
sebanyak 24 soal (69%), sedangkan soal yang perlu di reviu dan revisi adalah sebanyak 11
soal (31%).

Efektivitas Pengecoh
Suatu pilihan jawaban (pengecoh) dapat dikatakan berfungsi apabila pengecoh paling
tidak dipilih oleh 5% peserta tes atau lebih banyak dipilih oleh kelompok siswa yang belum
paham materi. Terdapat 140 pilihan jawaban (opsi) dari 35 butir soal yang diujikan, 35 opsi
merupakan kunci jawaban dan sisanya yaitu 105 merupakan pengecoh. Pada butir soal USBN
mata pelajaran IPA, pengecoh umumnya sudah berfungsi dengan baik. Hanya ada dua opsi
yang dipilih oleh kurang dari 5% peserta ujian. Opsi tersebut ada pada butir soal nomor 3
(opsi D) dan 21 (opsi D). Berdasarkan analisis dari efektifitas pengecoh, semua opsi
pengecoh dapat diterima dengan baik, kecuali kedua opsi pada kedua butir soal tersebut yang
perlu direviu kembali untuk meningkatkan efektifitas dari pengecoh.

Reliabilitas Instrumen
Berdasarkan hasil perhitungan, soal pilihan ganda USBN mata pelajaran IPA sudah
reliabel dengan harga koefisien sebesar 0,487 (dapat dilihat pada nilai Alpha sebesar 0.487).
Karena besarnya koefisien korelasi antara 0,40 – 0,70 (koefisien reliabilitas), soal tersebut
dapat dikatakan berkorelasi sedang (reliabel). Artinya, soal-soal tersebut memiliki
keterandalan yang sedang. Keterandalan yang dimaksud dalam hal ini meliputi ketepatan atau
kecermatan hasil pengukuran dan keajegan atau kestabilan dari hasil pengukuran sehingga
apabila dilakukan pengujian beberapa kali pada soal tes ini, akan memberikan hasil yang
tetap atau relatif sama.

Pembahasan hasil Interpretasi ITEMAN


Aspek yang paling utama dalam menentukan butir soal diterima atau tidak adalah daya
pembeda. Berdasarkan hasil di atas, butir soal yang memiliki daya pembeda yang sangat jelek
yaitu soal nomor 3 dan 22. Daya pembeda dapat dilihat dari nilai poin biserial pada hasil
output ITEMAN. Point biserial pada butir soal ini menunjukkan nilai yang negative (-0.068).
Jika daya pembeda negatif (<0) berarti lebih banyak kelompok bawah (warga belajar/peserta
didik yang tidak memahami materi) menjawab benar soal dibanding dengan kelompok atas
(warga belajar/peserta didik yang memahami materi yang diajarkan guru). Hal ini diperkuat
dengan hasil bahwa opsi B yang merupakan pengecoh memiliki poin biserial yang bernilai
positif, sedangkan opsi C yang merupakan kunci jawaban bernilai negative. Kunci harus
miliki poin biserial bernilai positif, sedangkan pengecoh bernilai negatif. Hal ini berarti siswa
kelompok bawah lebih banyak yang menjawab benar dibandingkan siswa kelompok atas.
Butir soal ini termasuk dalam kategori sukar karena hanya dapat dijawab benar oleh 19.6%
siswa. Jika dilihat pada konstruksi butir soal nomor 3 (gambar 3.1), baik stem maupun pokok
soal sudah jelas dan tidak ada bahasa yang rancu atau sulit dipahami.

Gambar 1. Soal nomor 3

Ada beberapa kemungkinan yang menjadi penyebab butir soal dikategorikan sukar dan
memiliki daya pembeda yang jelek. Salah satunya adalah siswa belum tuntas menguasai
materi yang diujikan, sehingga yang terjadi adalah siswa kelompok atas menjawab salah dan
siswa kelompok bawah menjawab benar. siswa belum memahami sepenuhnya konsep
perubahan fisika dan kimia. Akibatnya ketika dihadapkan pada contoh aplikasinya siswa
belum mampu membedakan mana contoh perubahan fisika atau kimia.
Pada butir soal nomor 22, daya pembeda bernilai negatif dan termasuk kategori butir soal
yang sukar. Pada soal ini, siswa dihadapkan pada soal tentang organel yang dimiliki oleh sel
tumbuhan dan hewan (gambar 3.2).
Gambar 2. Soal nomor 22
Seperti pada butir soal nomor 3, siswa kelompok bawah lebih banyak menjawab benar soal
ini dibandingkan siswa kelompok atas. Ada kemungkinan siswa tidak ingat atau tidak
menguasai sepenuhnya organel-organel apa yang dimiliki oleh sel hewan dan tumbuhan.
Walaupun soal ini cenderung bersifat hafalan, namun jika siswa sudah memahami dengan
tuntas materi tersebut tentunya siswa kelompok atas dapat menjawab dengan benar.
Soal lainnya yang memiliki daya pembeda yang jelek adalah soal nomor 6 (gambar 3.3)
tentang praktek pemisahan tinta dengan menggunakan kromatografi kertas. Pengecoh pada
opsi D semestinya memiliki poin biserial yang bernilai negatif namun pada hasil output
ternyata opsi ini memiliki nilai positif. Hal ini berarti bahwa siswa kelompok atas banyak
juga yang memilih opsi D selain opsi B yang merupakan kunci jawabannya. Hal inilah yang
menyebabkan daya pembeda pada butir soal ini termasuk dalam kategori jelek (P=0.102).

Gambar 3. Soal nomor 6


Jika dilihat dari konstruksi soal pada gambar di atas, opsi D memiliki perbedaan padanan kata
dengan ketiga opsi lainnya. Opsi A, B, C berhubungan dengan ”pemisahan” sedangkan opsi
D terdapat kata ”membuat”. Jika opsi D dikaitkan dengan pokok soal tentu sangat tidak
berhubungan, karena pada pokok soal terdapat kata ”pemisahan”. Kemungkinan yang
menjadi penyebab banyak siswa yang salah memilih jawaban adalah siswa tidak mengetahui
gambar apa yang dimaksud dalam soal tersebut. Soal ini dapat diperbaiki dengan
menambahkan keterangan pada gambar sehingga dapat memperjelas maksud dari gambar dan
pertanyaan. Hal ini juga dapat mengantisipasi siswa-siswa yang belum pernah melakukan
secara langsung praktek pemisahan dengan kromatografi kertas seperti yang digambarkan
dalam soal di atas.
Soal nomor 10 juga memiliki dua opsi dengan poin biserial positif sehingga menyebabkan
daya pembeda pada soal ini jelek (P=0.034). Pada gambar 3.4, siswa dihadapkan pada soal
tentang menghitung kalor yang dibutuhkan pada proses es yang mencair.

Gambar 4. Soal nomor 10


Kunci jawaban pada soal ini adalah D, namun lebih banyak siswa yang memilih opsi B.
Fungsi pengecoh salah satunya adalah untuk menunjukkan adanya kesalahan pemahaman
pada siswa. Jika siswa memiliki opsi B, ada kesalahan penghitungan dalam prosesnya. Untuk
menjawab soal ini, siswa harus menghitung dulu kalor yang dibutuhkan pada proses Q-R dan
R-S. Kemudian siswa tinggal menjumlahkan hasil yang didapat pada kedua proses tersebut.
Namun yang terjadi tidak demikian, sehingga siswa salah dalam menentukan jawaban. Hal
ini mungkin disebabkan pemahaman dan penalaran siswa yang kurang terhadap soal ini.
Kejadian serupa juga nampak pada hasil analisis soal nomor 14 tentang perhitungan gaya
yang dibutuhkan untuk menggeser tuas agar seimbang. Soal ini tergolong sukar bagi siswa
karena membutuhkan kemampuan analisis dan perhitungan dalam menyelesaikan soal ini.
Namun secara umum, tidak ada konstruksi kalimat yang salah pada kedua soal ini. Siswa
membutuhkan pemahaman dan latihan yang lebih dalam terhadap soal-soal semacam ini.

4.2 Hasil Analisis dengan Program ACER Conquest 2.0


Kococokan butir dengan model Rasch ditentukan berdasarkan nilai infit MNSQ dan infit t.
sebuah butir soal dinyatakan cocok dengan model Rasch dan dianggap valid apabila
mempunyai infit MNSQ antara 0,77 – 1,3 dan infit t antara -2 - +2. Berdasarkan hasil analisis
dengan menggunakan program CONQUEST didapatkan nilai infit MNSQ berkisar antara
0.96 – 1.07 dan dan nilai infit t antara -0.8 – 2.8. Jika diamati dari nilai infit MNSQ, semua
butir soal cocok dengan Rasch model karena berada dalam rentang 0.7 – 1.3. Namun terdapat
dua soal dengan nilai t di atas +2, yaitu soal nomor 12 dan 21. Namun mengingat semakin
besar ukuran sampel (n=655) akan memperbesar juga nilai t, maka nilai t pada hasil ini masih
dapat ditolerir selama nilai infit mnsq masih berada dalam rentang diterima.
Gambar 3.5 menunjukkan Wright map dengan skala logit untuk 35 butir soal IPA pada
siswa di Kabupaten X. Sisi sebelah kiri menunjukkan kemampuan siswa pada soal USBN
IPA, sedangkan sisi sebelah kanan menunjukkan tingkat kesukaran soal.

Gambar 5. Item-person map

Kemampuan siswa yang berada dibawah 0 logit menunjukkan bahwa kemampuan siswa
dalam mengerjakan soal USBN IPA masih rendah. Sebaliknya kemampuan siswa di atas
skala 0 logits menunjukkan kemampuan yang lebih tinggi dalam soal USBN IPA. Demikian
halnya dengan tingkat kesukaran soal. Soal yang sukar adalah soal yang berada di atas skala 0
logits sedangkan soal yang mudah berada di bawah skala 0 logits. Berdasarkan grafik
tersebut, sebagian besar siswa pada Kabupaten X memiliki kemampuan yang rendah dalam
soal USBN mata pelajaran IPA. Tingkat kesukaran soal hamper merata antara soal yang
sukar dan yang mudah. Ada 11 soal yang paling sukar yaitu soal nomor 3, 4, 9, 10, 14, 15,
16, 17, 20, 22, dan 35. Namun demikian, soal-soal ini terlalu sukar bagi siswa di Kabupaten
X. hal ini dibuktikan dengan tidak adanya siswa yang terpetakan dalam soal-soal tersebut.
Seperti yang telah dibahas pada hasil analisis soal secara klasik, ada kemungkinan siswa di
Kabupaten X belum diajarkan atau belum memehami secara tuntas materi-materi yang
diujikan pada soal tersebut. Hal ini perlu mendapatkan perhatian yang serius dari para guru
IPA agar lebih dapat meningkatkan lagi proses belajar di kelas sehingga ketuntasan materi
IPA khususnya pada materi-materi dengan soal yang diujikan seperti ini dapat dipelajari lebih
dalam.

5. Kesimpulan
Berdasarkan deskripsi hasil penelitian dan pembahasan yang telah diuraikan pada bab
sebelumnya, maka dapat ditarik kesimpulan bahwa:
1. Berdasarkan analisis menggunakan ITEMAN (teori klasik), 47% soal termasuk kategori
sukar dan 53% termasuk kategori sedang; terdapat 11 soal (31%) soal yang perlu di
revisi berdasarkan daya pembeda; hanya 2 opsi pengecoh yang kurang berfungsi dengan
baik; reliabilitas instrument termasuk dalam kategori sedang.
2. Berdasarkan hasil analisis menggunakan ACER CONQUEST (teori modern), 35 butir
soal cocok ke dalam model Rasch; 11 soal termasuk kategori sangat sukar; sebagian
besar kemampuan responden/siswa berada terhadap soal USBN mata pelajaran IPA
masih dibawah skala 0 logits.

6. Saran
Berdasarkan kesimpulan yang telah dipaparkan di atas, peneliti memberikan beberapa
saran yaitu :
1. Bagi guru: penting sekali melakukan analisis soal agar dapat diketahui sudah sejauh
mana pemahaman dan kemampuan siswa untuk mater-materi yang telah diajarkan
sehingga dapat memberi umpan balik bagi guru dalam membenahi proses belajar
mengajar di kelas. Selain itu, melalui analisis soal guru dapat meningkatkan
kompetensinya dalam mengembangkan instrument tes yang valid dan reliable
2. Bagi sekolah diharapkan dapat memberikan motivasi kepada pengajar untuk
melaksanakan proses evaluasi yang mununjang kualitas dari kegiatan pembelajaran,
terutama pada pelaksanaan analisis butir soal. Hal ini perlu dilakukan agar proses
pembelajaran menjadi lebih baik dan bermutu sehingga tujuan pembelajaran yang telah
ditentukan dapat tercapai serta kemampuan sesungguhnya dari pembelajar dapat
diketahui.
3. Bagi Dinas Pendidikan diharapkan dapat lebih sering melakukan kegiatan analisis soal
khusus untuk soal-soal USBN dan memanfaatkan hasilnya untuk di jadikan bank soal
yang dapat diakses oleh semua guru.

7. Daftar Pustaka
Arikunto, Suharsimi (2009). Dasar-Dasar Evaluasi Pendidikan. Jakarta: Bumi Aksara.

Hambleton, Ronald K (1993). Principles and Selected Applications of Item Response Theory
(3rd Edition). Phoenix: American Council on Education.

Inayahtur Rofiqoh (2011). Analisis Butir Soal Ujian Madrasah Mata Pelajaran Fisika
Menggunakan Taksonomi Bloom Ranah Kognitif Kelas XII MA Negeri Kendal Tahun
Pelajaran 2010/2011: Skripsi. Semarang: Fak. Tarbiyah Institut Agama Islam Negeri
Walisongo.

Kementrian Pendidikan Nasional (2010). Panduan Analisis Butir Soal. Jakarta: tidak
diterbitkan.

Tika Dwi Rahayu, Bambang Hari Purnomo, Sukidin (2014). Analisis Tingkat Kesukaran dan
Daya Beda Pada Soal Ujian Tengah Semester Ganjil Bentuk Pilihan Ganda Mata
Pelajaran Ekonomi Kelas X di SMA Negeri 5 Jember Tahun Ajaran 2012-2013. Jurnal
Edukasi UNEJ , I (1): Hlm. 39-43

Você também pode gostar