Escolar Documentos
Profissional Documentos
Cultura Documentos
Disusun oleh:
Kelompok 11
Eka Purwanti (1610211009)
Windasari (1610211015)
Ria Ade Noer Hazila (1610211026)
Dalam dunia pendidikan, penilaian merupakan bagian yang tidak terpisahkan dari proses
belajar mengajar. Sistem penilaian yang baik akan mendorong guru menggunakan strategi
mengajar yang lebih baik dan memotivasi anak untuk belajar lebih giat. Penilaian biasanya
dimulai dengan kegiatan pengukuran. Pengukuran (measurement ) merupakan cabang ilmu
statistika terapan yang bertujuan untuk membangun dasar-dasar pengembangan tes yang lebih
baik sehingga menghasilkan tes yang berfungsi secara optimal, valid, dan reliabel. Proses belajar
mengajar dilaksanakan tidak hanya untuk kesenangan atau bersifat mekanis saja tetapi
mempunyai misi atau tujuan bersama. Dalam usaha untuk mencapai misi dan tujuan itu perlu
diketahui apakah usaha yang dilakukan sudah sesuai dengan tujuan? Untuk mengetahui apakah
tujuan pendidikan sudah tercapai perlu diadakan tes. Sebuah tes yang dapat baik sebagai alat
pengukur harus dianalisis terlebih dahulu. Dalam menganalisis butir soal dalam tes harus
memperhatikan daya serap, tingkat kesukaran, daya beda, fungsi pengecoh, validitas dan
reabilitas. Analisis butir soal atau analisis item adalah pengkajian pertanyaan-pertanyaan tes agar
diperoleh perangkat pertanyaan yang memiliki kualitas yang memadai. Menganalisis butir soal
merupakan suatu kegiatan yang harus dilakukan guru untuk meningkatkan mutu soal yang
dibuat. Kegiatan ini merupakan proses pengumpulan, peringkasan, dan penggunaan informasi
dari jawaban siswa untuk membuat keputusan tentang setiap penilaian. Soal yang bermutu
adalah soal yang dapat memberikan informasi setepat-tepatnya sesuai dengan tujuannya di
antaranya dapat menentukan peserta didik mana yang sudah atau belum menguasai materi yang
diajarkan guru (Sartika, 2013). Dalam analisis butir soal terdapat dua istilah yang digunakan
yaitu karakteristik dan spesifikasi butir soal. Analisis soal secara kuantitatif menekankan pada
karakteristik internal tes melalui data yang diperoleh secara empiris. Dalam menentukan
karakteristik butir soal, pada umumnya dipertimbangkan tiga hal, yaitu: (1) tingkat kesukaran,
(2) daya beda, dan (3) berfungsi tidaknya pilihan jawaban atau pengecoh. Karakter-karakter butir
soal tersebut sangat menentukan kualitas butir soal. Mengukur tingkat kesukaran, daya pembeda,
dan pengecoh diharapkan akan mampu memberikan informasi yang akurat tentang kemampuan
siswa yang sebenarnya. Pengukuran tingkat pengecoh soal dipergunakan pada analisis soal
pilihan ganda yang memiliki alternatif jawaban lebih dari satu, sedangkan pada soal uraian tidak
memiliki pengecoh soal.
KAJIAN TEORI
Menurut M.Nasir dkk (2012) banyak guru-guru yang di sekolah tidak melakukan
analisis butir soal untuk evaluasi disebabkan karena:
1. Kekurangan waktu untuk melakukan analisis
2. Analisis butir soal dirasakan masih sukar karena melibatkan rumus-rumus yang komplit
dan melelahkan.
3. Tidak adanya/belum adanya alat bantu yang memudahkan untuk melakukan analisis
butir soal.
Dalam hal ini, item yang baik adalah item yang tingkat kesukarannya dapat
diketahui, tidak terlalu sukar dan tidak terlalu mudah. Sebab, tingkat kesukaran item
itu memiliki korelasi dengan daya pembeda. Bilamana item memiliki tingkat
kesukaran yang maksimal, maka daya pembedanya akan rendah, demikian pula bila
item itu terlalu mudah maka tidak akan memiliki daya pembeda.
Oleh karena itu, sebaiknya tingkat kesukaran soal itu dipertahankan dalam batas
yang mampu memberikan daya pembeda. Namun, jika terdapat tujuan khusus dalam
penyusunan tes, maka tingkat kesukaran itu bisa dipertimbangkan. Misalnya, tingkat
kesukaran item untuk tes sumatif berbeda dengan tingkat kesukaran pada tes
diagnostik. Untuk menghitung taraf kesukaran soal dari suatu tes dipergunakan rumus
sebagai berikut:
𝐔+𝐋
TK =
𝐓
Keterangan:
U = jumlah siswa yang termasuk kelompok pandai (upper group) yang menjawab
benar untuk tiap soal.
L = jumlah siswa yang termasuk kurang (lower group) yang menjawab benar untuk
tiap soal.
T = jumlah siswa dari kelompok pandai dan kelompok kurang (jumlah upper group
dan lower group)
Misalkan suatu tes yang terdiri atas N soal yang diberikan kepada 40 siswa. Dari hasil
tes tersebut, tiap-tiap soal dianalisis taraf kesukarannya, mula-mula hasil tes itu kita
susun ke dalam peringkat, kemudian kita ambil 25% (10 lembar jawaban siswa
kelompok pandai), dan 10 lembar jawaban siswa dari kelompok yang kurang pandai.
Kemudian kita tabulasikan. Misalkan dari tabulasi soal kita peroleh hasil sebagai
berikut: yang menjawab benar dari kelompok pandai ada 9 siswa, dan yang menjawab
benar dari kelompok kurang pandai ada 4 siswa.
Dengan menggunakan rumus diatas, maka taraf kesukaran atau TK dari soal adalah:
𝐔+𝐋 𝟗+𝟒
TK = = = 0,65 atau 65%
𝐓 𝟐𝟎
Jadi dapat disimpulkan bahwa nilai dari TK atau tingkat kesukarannya adalah 65%.
Sedangkan dalam bukunya Drs. H. Daryanto, rumus untuk mencari taraf kesukaran
atau indeks kesukaran adalah:
P= B
JS
Keterangan:
P = indeks kesukaran
B = banyaknya siswa yang menjawab soal itu dengan benar.
JS = jumlah seluruh siswa peserta tes.
Contoh:
Jumlah siswa peserta tes dalam suatu kelas ada 40 siswa. Dari 40 siswa tersebut
terdapat 12 siswa yang mampu mengerjakan soal no. 1 dengan benar. Maka berapa
indeks kesukarannya?
Jawab:
P = B
JS
= 12
40
= 0,30
Menurut ketentuan yang sering diikuti, indeks kesukaran sering diklasifikasikan
sebagai berikut:
a. Soal dengan P 0,00 sampai 0,30 adalah soal sukar.
b. Soal dengan P 0,30 sampai 0,70 adalah soal sedang.
c. Soal dengan P 0,70 sampai 1,00 adalah soal mudah.
2. Daya Pembeda
Perhitungan daya pembeda adalah pengukuran sejauh mana suatu butir soal
mampu membedakan peserta didik yang sudah menguasai kompetensi dengan peserta
didik yang belum atau kurang menguasai kompetensi berdasarkan kriteria tertentu.
Semakin tinggi koefisien daya pembeda suatu butir soal, semakin mampu butir soal
tersebut membedakan antara peserta didik yang menguasai kompetensi dengan
pesertan didik yang kurang menguasai kompetensi.
Angka yang menunjukkan besarnya daya pembeda disebut indeks diskriminasi. Daya
pembeda suatu soal tes dapat dihitung dengan menggunakan rumus sebagai berikut:
𝐔−𝐋
DP = 𝟏
𝐓
𝟐
Keterangan:
DP = indeks DP atau daya pembeda yang dicari.
U = jumlah siswa yang termasuk dalam kelompok pandai yang mampu menjawab
benar untuk tiap soal.
L = jumlah siswa yang termasuk kurang yang menjawab benar untuk tiap soal.
T = jumlah siswa keseluruhan.
Contoh:
Dari hasil tes lomba olimpiade IPS, jumlah siswa yang dites adalah 40 siswa,
sedangkan tes tersebut terdiri dari 20 soal. Setelah hasil tes tersebut diperiksa,
kemudian disusun ke dalam peringkat untuk menentukan 25% siswa yang termasuk
kelompok pandai (upper group) dan 25% siswa yang termasuk kelompok
kurang (lower group).
Kemudian hasil tes tersebut ditabulasikan dengan menggunakan format tabulasi
jawaban tes, kemudian hasil tabulasi dari kedua kelompok tersebut dimasukkan ke
dalam format analisis soal tes, sehingga kita dapat menghitung tingkat kesukaran dan
daya pembeda tiap soal yang kita analisis.
Misalkan dari tabulasi soal no. 1 kita peroleh hasil sebagai berikut: yang menjawab
benar dari kelompok pandai ada 10 siswa, dan yang menjawab benar dari kelompok
kurang ada 9 siswa. Maka daya pembedanya adalah:
DP = U – L
½T
= 10 – 9
½ x (20)
= 1
10
= 0,10
Jadi dapat disimpulkan bahwa indeks pembedanya adalah 0,10.
Dalam bukunya Prof. Dr. Suharsimi Arikunto, dijelaskan mengenai klasifikasi daya
pembeda, yaitu:
D = 0,00 – 0,20 = jelek (poor).
D = 0,20 – 0,40 = cukup (satisfactory).
D = 0,40 – 0,70 = baik (good).
D = 0,70 – 1,00 = baik sekali (excellent).
3. Analisis pengecoh (Efektifitas Distraktor )
Analisis distraktor (pengecoh) dilakukan untuk mengetahui keberfungsian suatu
pilihan (option) jawaban dalam soal berbentuk pilihan ganda. Distraktor (pengecoh) yang
tidak dipilih sama sekali oleh testee (yang diuji/siswa) menunjukkan pengecoh tersebut
buruk, kemungkinan terlalu mencolok dan menyesatkan. Sebuah distraktor dikatakan
berfungsi, apabila paling sedikit dipilih oleh 5% pengikut tes.
Contoh:
Dari analisis sebuah soal yang mempunyai empat pilihan jawaban (Option), diperoleh
pola jawaban sebagai berikut.
Kelompok atas 5 7 5 3 0 30
Kelompok 8 8 6 5 3 30
bawah
Jumlah 13 15 21 9 3 60
Butir soal yang baik pengecohnya akan dipilih secara merata oleh peserta didik
yang menjawab salah. Sebaliknya, butir soal yang kurang baik, pengecohnya akan dipilih
secara tidak merata. Pengecoh dianggap baik bila jumlah peserta didik yang memilih
pengecoh itu sama atau mendekati jumlah ideal. Indeks pengecoh dihitung dengan rumus:
IP = P x 100%
(N - B) (n - 1)
Keterangan:
IP = indeks pengecoh
P = jumlah peserta didik yang memilih pengecoh
N = jumlah peserta didik yang ikut tes
B = jumlah peserta didik yang menjawab benar pada setiap soal
n = jumlah alternatif jawaban
1 = bilangan tetap
Catatan:
Jika semua peserta didik menjawab benar pada butir soal tertentu (sesuai kunci jawaban),
maka IP = 0 yang berarti soal tersebut jelek. Dengan demikian pengecoh tidak berfungsi.
Contoh:
50 orang peserta didik dites dengan 10 soal bentuk pilihan ganda. Tiap soal memiliki
alternatif jawaban (a, b, c, d, e). Kunci jawaban (jawaban yang benar) no. 8 adalah c.
Setelah soal no.8 diperiksa untuk semua peserta didik, ternyata dari 50 orang peserta
didik, 20 peserta didik menjawab benar dan 30 peserta didik menjawab salah. Idealnya,
pengecoh dipilih secara merata.
Berikut ini adalah contoh soal no.8.
Alternatif jawaban A B C D E
Distribusi jawaban
7 8 20 7 8
peserta didik
IP 93% 107% ** 93% 107%
Kualitas pengecoh ++ ++ ++ ++ ++
Keterangan:
** = kunci jawaban
++ = sangat baik
+ = baik
= kurang baik
_ = jelek
_ _ = sangat jelek
Pada contoh diatas, IP butir a, b, c, d, dan e adalah 93%, 107%, 93%, dan 107%.
Semuanya dekat dengan angka 100%, sehingga digolongkan sangat baik sebab semua
pengecoh itu berfungsi. Jika pilihan jawaban peserta didik menumpuk pada satu alternatif
jawaban, misalnya seperti berikut:
Alternatif jawaban A B C D E
Distribusi jawaban peserta didik 20 2 20 8 0
IP 267% 27% ** 107% 0%
Kualitas pengecoh _ - ** ++ _
Dengan demikian, dapat ditafsirkan pengecoh (d) yang terbaik, pengecoh (e) dan
(b) tidak berfungsi, pengecoh (a) menyesatkan, maka pengecoh (a) dan (e) perlu diganti
karena termasuk jelek, dan pengecoh (b) perlu direvisi karena kurang baik. adapun
kualitas pengecoh berdasar indeks pengecoh adalah:
Sangat baik IP = 76% - 125%
Baik IP = 51% - 75% atau 126% - 150%
Kurang baik IP = 26% - 50% atau 151% - 175%
Jelek IP = 0% - 25% atau 176% - 200%
Sangat jelek IP = lebih dari 200%
Hasil diskusi
Beberapa hal yang perlu diperhatikan dalam memperbaiki butir soal adalah sebagai berikut:
1. Perhatikan tingkat kesukaran butir soal. Butir soal dianggap baik jika mempunyai indeks
tingkat kesukaran (P) antara 0,25 sampai dengan 0,75 atau yang mendekati angka
tersebut.
2. Perhatikan daya pembeda butir soal. Butir soal dianggap baik jika kunci (jawaban soal)
mempunyai indeks daya pembeda positif tinggi dan pengecohnya mempunyai indeks
daya pembeda negatif.
3. Perhatikan stem atau pokok soalnya sebab stem yang ambigius akan membingungkan
peserta ujian untuk menentukan jawabannya.
Ada beberapa teknik yang dapat digunakan untuk menganalisis butir soal secara kualitatif,
diantaranya adalah teknik moderator dan teknik panel.
Teknik moderator merupakan teknik berdiskusi yang di dalamnya terdapat satu orang
sebagai penengah. Berdasarkan teknik ini, setiap butir soal didiskusikan secara bersama-sama
dengan beberapa ahli seperti guru yang mengajarkan materi, ahli materi, penyusun/pengembang
kurikulum, ahli penilaian, ahli bahasa, berlatar belakang psikologi. Teknik ini sangat baik karena
setiap butir soal dilihat secara bersama-sama berdasarkan kaidah penulisannya. Di samping itu,
para penelaah dipersilakan mengomentari/memperbaiki berdasarkan ilmu yang dimilikinya.
Setiap komentar/masukan dari peserta diskusi dicatat oleh notulis. Setiap butir soal dapat
dituntaskan secara bersama-sama, perbaikannya seperti apa. Namun, kelemahan teknik ini
adalah memerlukan waktu lama untuk rnendiskusikan setiap satu butir soal.
Teknik panel merupakan suatu teknik menelaah butir soal yang setiap butir soalnya ditelaah
berdasarkan kaidah penulisan butir soal, yaitu ditelaah dari segi materi, konstruksi,
bahasa/budaya, kebenaran kunci jawaban/pedoman penskorannya yang dilakukan oleh beberapa
penelaah. Caranya adalah beberapa penelaah diberikan: butir-butir soal yang akan ditelaah,
format penelaahan, dan pedoman penilaian/ penelaahannya.
Format Penelaahan Butir Soal Bentuk Uraian
FORMAT PENELAAHAN BUTIR SOAL BENTUK URAIAN
Nomor Soal
1 2 3 4 5 6 7 8 9 …
No. Aspek yang ditelaah
A. Materi
1 Soal sesuai dengan indikator (menuntut tes tertulis
untuk bentuk Uraian) Batasan pertanyaan dan
2 jawaban yang diharapkan sudah sesuai
Materi yang ditanyakan sesuai dengan kompetensi
3 (urgensi, relevasi, kontinyuitas, keterpakaian sehari-
hari tinggi)
Isi materi yang ditanyakan sesuai dengan jenjang
jenis sekolah atau tingkat kelas
4
Konstruksi
Menggunakan kata tanya atau perintah yang menuntut
jawaban uraian
B Ada petunjuk yang jelas tentang cara mengerjakan
5 soal
Ada pedoman penskorannya
6 Tabel, gambar, grafik, peta, atau
7
8
Nomor Soal
1 2 3 4 5 6 7 8 9 …
No. Aspek yang ditelaah
yang sejenisnya disajikan dengan jelas dan
terbaca
C. Bahasa/Budaya
9 Rumusan kalimat coal komunikatif
10 Butir soal menggunakan bahasa
Indonesia yang baku
11 Tidak menggunakan kata/ungkapan yang
menimbulkan penafsiran ganda atau salah
pengertian
12 Tidak menggunakan bahasa yang berlaku
Keterangan: Berilah tanda (V) bila tidak sesuai dengan aspek yang ditelaah!
setempat/tabu
13 Rumusan soal tidak mengandung
Langkah-Langkah dalam Penyusunan Tes :
Tentu saja setiap guru akan dengan mudah mengatakan bagian pelajaran mana yang
akan dicakup dalam sebuah tes jika sudah diketahui tujuanya.
Urutan langkah yang dilakukan adalah:
1. Menentukan tujuan mengadakan tes.
2. Mengadakan pembatasan terhadap bahan yang akan diteskan.
3. Merumuskan tujuan intruksional khusus dari tiap bagian bahan.
4. Menderetkan semua TIK dalam tabel persiapan yang memuat pula aspek tingkah laku
terkandug dalam TIK itu. Tabel ini digunakan untuk mengadakan identifikasi terhadap
tingkah laku yang dikehendaki, agar tidak terlewati.
Contoh :
Tabel TIK dan aspek tingkah laku yang dicakup :
No TIK Aspek Tingkah Ingatan Pemahaman Aplikasi Keterangan
Laku
1 Ssiswa dapat menjumlah
2 bilangan bersusun. ü ü
2 Siswa dapat merangkum
hukum komulatif dan ü ü
seterusnya
1. Menyusun tabel spesifikasi yang memuat pokok materi, aspek berpikir yang diukur
beserta imbangan antara kedua hal tersebut.
2. Menuliskan butir-butir soal, didasarkan atas TIK-TIK yang sudah di tuliskan pada tabel
TIK dan aspek tingkah laku yang dicakup.
Banyak faktor yang dapat mempengaruhi hasil tes evaluasi tidak valid. Beberapa faktor
tersebut secara garis besar dapat dibedakan menurut sumbernya, yaitu faktor internal dari tes,
faktor eksternal tes, dan faktor yang berasal dari siswa yang bersangkutan :
Salah satu upaya dalam meningkatkan kualitas proses dan hasil belajar sebagai bagian
dari peningkatan kualitas pendidikan dapat dilakukan melalui sistem penilaian. Dalam
penilaian proses dan hasil belajar siswa di sekolah, guru memberikan suatu evaluasi untuk
mengetahui sejauh mana penguasaan materi yang telah dikuasai oleh siswa selama proses
belajar mengajar mengenai materi yang disampaikan. Dalam melaksanakan kegiatan
evaluasi, berhasil atau tidaknya sangat ditentukan oleh tepat atau tidaknya pelaksanaan ujian.
Untuk melaksanakan ujian ini memerlukan alat-alat. Bagi ujian tertulis maka alatnya adalah
butir-butir soal tertulis. Bagi ujian lisan maka alatnya adalah butir soal tertulis yang
disediakan bagi setiap testi, atau sekurang-kurangnya pokok pertanyaan yang sudah tertulis
dan dipersiapkan sebelumnya. Bagi ujian praktek, maka alatnya adalah lembar pengamatan
yang berisi segi-segi yang diamati beserta rentang skor masing-masing. Idealnya sebelum
suatu tes dipergunakan maka tes tersebut harus memenuhi syarat-syarat sebagi tes yang baik,
maka tes yang bersangkutan perlu diuji cobakan. Namun sebelum diuji cobakan tes tersebut
harus memperlihatkan indokator-indikator sebagai tes yang baik. Dalam hal ini dilakukan
suatu analisis butir soal.
Tes yang baik harus memiliki beberapa criteria diantaranya harus valid, reliable,
punya daya pembeda, punya daya pengecoh dan dan memperhatikan tingkat kesukaran. Hasil
tes perlu dilakukan analisis butir soal untuk memperbaiki kualitas tes yang akan digunakan
untuk masa yang akan datang.
PENUTUP
Menganalisis butir soal merupakan suatu kegiatan yang harus dilakukan guru untuk
meningkatkan mutu soal yang dibuat. Analisis butir soal dapat dilakukan secara kualitatif dan
kuantitatif. Kriteria kualitas butir soal dapat ditentukan dengan cara validitas dan realibilitas.
Tujuan analisis soal yaitu untuk mengkaji dan menelaah setiap butir soal agar diperoleh soal
yang bermutu, sedangkan manfaatnya dapat membantu pengguna tes dalam mengevaluasi
kualitas tes yang digunakan. Dalam menganalisis butir soal harus diperhatikan tingkat
kesukarannya karena butir soal yang terlalu sukar atau terlalu mudah tidak banyak memberi
informasi tentang butir soal atau peserta tes. Ada beberapa teknik yang dapat digunakan
untuk menganalisis butir soal secara kualitatif, diantaranya adalah teknik moderator dan
teknik panel.
DAFTAR PUSTAKA
Yusuf Muri, 2014. Metode Penelitian: Kuantitatif, Kualitatif, dan Penelitian Gabungan.
Jakarta: KENCANA
Tobari, 2015. Evaluasi Soal-soal Penerimaan Pegawai Baru.Sleman: CV BUDI UTAMA.
Farida Ida, 2017. Evaluasi Pebelajaran. Bandung: PT Remaja Rosdakarya.
Internet Online: https://www.amongguru.com/download-aplikasi-analisis-butir-soal-bentuk-
pilihan-ganda-dan-uraian/
Internet Online:
http://staffnew.uny.ac.id/upload/132231727/pendidikan/22.+Materi+Kuliah+Evaluasi+Pembe
lajaran.pdf