Você está na página 1de 15

ANALISIS KUALITAS ALAT UKUR SECARA KUANTITATIF

A. Konsep Dasar Kualitas Alat Ukur


1. Validitas Alat Ukur
Validitas alat ukur adalah ketepatan alat ukur dengan hal yang diukur. Ada beberapa jenis
validitas alat ukur, yaitu: (1) Validitas isi (content validity), (2) validitas konstruksi
(construct validity), (3) validitas ramalan (predictive validity), dan (4) validitas sama saat
(concurrent validity).

Validitas Isi (Content Validity)


Suatu tes dikatakan valid dari segi isinya apabila mengukur tujuan khusus tertentu yang
sejajar dengan sisi atau materi pelajaran yang diberikan. Oleh karena isi pelajaran ini
terdapat pada kurikulum, sering juga disebut validitas “kurikuler”. Validitas isi dapat dilihat
dari kisi-kisi atau spesifikasi instrumen (alat ukur), yaitu dengan cara mengkaji butir-butir
instrumen tersebut, apakah telah mewakili materi secara keseluruhan atau belum
representatif.

Validitas Konstruksi (Construct Validity)


Validitas konstruksi adalah validitas yang berkenaan dengan kesanggupan alat ukur
tersebut untuk mengukur pengertian-pengertian yang terkandung dalam materi yang
diukurnya. Suatu alat ukur dikatakan valid dari segi konstruksinya apabila butir-butir
alat ukur tersebut mengukur setiap aspek berpikir seperti yang disebutkan dalam Tujuan
Pembelajaran atau Sasaran Belajar.

Validitas Sama Saat atau yang ada Sekarang (Concurrent Validity)


Suatu tes dikatakan memiliki validitas concurrent atau validitas empiris apabila hasil
pengukuran sesuai dengan pengalaman yang ada pada saat ini. Pengalaman itu selalu
mengenai hal yang telah terjadi sehingga data tersebut sekarang telah ada (konkuren =
ada sekarang).
Validitas Ramalan (predictive validity)
Validitas ramalan adalah validitas alat ukur yang berkenaan dengan kemampuan alat
ukur tersebut untuk meramalkan suatu ciri atau perilaku tertentu. Suatu alat ukur
dikatakan memiliki validitas prediktif apabila alat ukur tersebut mempunyai kemampuan
untuk meramalkan (memprediksi) apa yang akan terjadi di masa yang akan datang.
Keempat jenis validitas tersebut dapat digambarkan sebagai berikut.

Validitas

Validitas Logikal (Teoretik) Validitas Empiris

Validitas
Validitas Isi Isi ValiditasKonkuren
Validitas Konkuren

Validitas
Validitas Konstruksi
Konstruksi ValiditasRamalan
Validitas Prediksi

Gambar 1. Penggolongan Validitas Alat Ukur

2. Reliabilitas Alat Ukur


Reliabilitas alat ukur adalah keterandalan alat ukur atau keajegan alat ukur; artinya,
kapanpun alat ukur itu digunakan akan menghasilkan hasil ukur yang relatif tetap. Ada
beberapa jenis reliabilitas, yaitu: (1) konsistensi internal, (2) stabilitas, dan (3) ekuivalen.
Reliabilitas konsistensi internal alat ukur dapat dihitung dengan menggunakan rumus
Koefisien Alpha-Cronbach, Kuder-Richardson (KR-20 atau KR-21), dan Teknik Belah
Dua. Sedangkan reliabilitas stabilitas atau test-retest dapat dihitung dengan
menggunakan teknik korelasi product moment. Selanjutnya, reliabilitas ekuivalen atau tes
setara atau sejajar dapat dihitung dengan menggunakan teknik korelasi product moment
Faktor-faktor yang mempengaruhi tingkat reliabilitas, antara lain sebagai berikuti ini.
a. Panjang tes (banyak sedikitnya butir tes); semakin panjang tes, semakin tinggi
reliabilitasnya. Cara meningkatkan reliabilitas dengan penambahan butir tes, sebagai
berikut.
n.r
rnn 
1  n  1r
r = koefisien reliabilitas
rnn = koefisien relibilitas setelah butir tes ditambahkan
n = ratio penambahan butir: “jumlah butir akhir dibagi jumlah butir semula
Misalnya koefisien reliabilitas semula r = 0,70
Jumlah butir awal = 40
Jumlah butir akhir = 60
N = 60 : 40 = 1,5, kemudian masukkan harga r dan n ke dalam rumu r nn tersebut di
atas.
n.r 1,5 x0,70 1,05
rnn     0,78
1  n  1r 1  1,5  10,70 1,35
Ini berarti dengan menambah 20 butir tes dari jumlah butir tes semua 40 butir, ternyata
mampu meningkatkan koefisien reliabilitas dari 0,70 menjadi 0,78 atau naik sekitar
0,08.
b. Karakteristik Testee
Tes yang dicobakan kepada kelompok yang diambil secara acak (random), akan
menunjukkan reliabilitas lebih besar daripada yang dicobakan pada kelompok
nonrandom.
c. Proses pelaksanaan tes (pengadministrasian tes), seperti:(1) Kejelasan petunjuk
mengerjakan tes, (2) Ketertiban pengawas tes, dan (3) Suasana lingkungan dan
tempat diselenggarakannya tes

3. Taraf Kesukaran Tes


Taraf kesukaran tes adalah kesulitan tes dipandang dari kemampuan peserta didik untuk
menjawab soal tersebut; artinya, tes tersebut akan lebih banyak dapat dijawab benar
oleh peserta didik yang pandai dan lebih banyak dijawab salah oleh peserta didik yang
bodoh. Taraf kesukaran tes yang baik adalah antara 20% - 80% atau antara 30% - 70%.

4. Daya Pembeda Tes


Daya pembeda tes adalah kemampuan tes untuk membedakan antara peserta didik
yang pandai dan bodoh; artinya, jika tes tersebut diberikan kepada anak yang tergolong
pandai akan lebih banyak dapat dijawab dengan benar, sedangkan jika diberikan kepada
peserta didik yang tergolong bodoh akan lebih banyak dijawab salah. Daya pembeda tes
yang baik adalah antara 20% - 80% atau antara 30% - 70%.

5. Analisis pengecoh
Pengecoh atau distractor yang baik adalah pengecoh yang dapat mengecoh peserta didik
; artinya, pengecoh tersebut dapat mengecoh peserta didik atau paling sedikit pengecoh
tersebut dipilih oleh 2% atau 3% dari peserta tes.

B. Formula Analisis Kualitas Alat Ukur Tes dan Non Tes


1. Menganalisis Validitas Instrumen
Berikut akan diuraikan mengenai cara menghitung validitas empiris (Validitas butir tes).
Jika datanya berbentuk polytomi, sebaiknya menggunakan korelasi Product Moment
dengan rumus berikut.
𝑁 ∑ 𝑋𝑌−(∑ 𝑋)(∑ 𝑌)
Rumus: 𝑟𝑥𝑦 =
√(𝑁 ∑ 𝑋 2 −(∑ 𝑋)2 )(𝑁 ∑ 𝑌 2 −(∑ 𝑌)2 )

Keterangan:
N = banyaknya kasus atau sampel
X = skor butir tes
Y = skor total
Tabel 1. Cara menghitung Validitas Butir Instrumen
Nomor Butir s
Responden Total
1 2 3 4 5 6 7 8 9 10
A 3 5 4 3 4 5 3 4 5 4 40
B 4 5 5 3 5 4 4 5 5 4 44
C 2 3 4 2 3 4 4 3 4 4 33
D 1 3 4 3 3 3 3 3 3 3 29
E 3 4 5 3 4 3 3 4 3 4 36
F 1 2 3 2 1 2 1 2 3 2 19
G 3 3 4 2 1 3 2 2 3 3 26

Misalnya, cara untuk menghitung validitas butir alat ukur nomor 1, digunakan rumus
product moment. Berdasarkan rumus tersebut, setelah dihitung dengan kalkulator
diperoleh harga rxy = 0,769. Sedangkan rxy tabel pada taraf signifikansi 5% dari tujuh
peserta (N = 7) adalah 0,754. Ternyata harga rxy hitung lebih besar daripada harga rxy
tabel. Oleh karena itu dapat diinterpretasikan bahwa butir tes nomor 1 adalah valid.
Contoh analisis butir nomor 6 sebagai berikut.
Tabel 2. Cara Menghitung Korelasi Skor Butir dengan Skor Total
X Y XY X2 Y2
5 40 200 25 1600
4 44 176 16 1936
4 33 132 16 1089
3 29 87 9 841
3 36 108 9 1296
2 19 38 4 361
3 26 78 9 676
Σ 24 Σ 227 Σ 819 Σ 88 Σ 7799

7𝑥819 − (24𝑥227)
𝑟𝑥𝑦 =
√(7𝑥88 − 242 )(7𝑥7799 − 2272 )
𝑟𝑥𝑦 = 0,814

Suatu butir tes dinyatakan valid jika rxy hitung lebih besar daripada rxy tabel dengan
taraf signifikansi atau taraf kekeliruan 5% (rxy-hit > rxy-tab dengan t.s 5%).

Koefisien korelasi yang diperoleh antara skor butir 6 dengan skor total = 0,814.
Kemudian, koefisien korelasi tersebut dibandingkan dengan nilai-nilai produk momen
yang ada pada tabel statistik. Dalam hal ini, untuk n = 7 dan pada taraf signifikansi 5% =
0,754. Dengan demikian, nilai r hitung = 0,814 lebih besar dari nilai r pada tabel untuk
taraf signifikansi 5%, sehingga nilai r hitung signifikan. Ini berarti butir nomor 6 adalah
valid. Demikian seterusnya, validitas butir tes yang lain dapat dihitung dengan cara yang
sama.

Untuk data yang berbentuk dikotomi, sebaiknya menggunakan teknik Korelasi Point
Biserial, dengan rumus sebagai berikut.

𝑀𝑝 − 𝑀𝑡 𝑝
𝑟𝑝𝑏𝑖 = √
𝑆𝑡 𝑞

Keterangan:
rpbi = koefisien korelasi point biserial
Mp = rerata skor dari subjek yang menjawab betul bagi butir yang dicari validitasnya
Mt = rerata skor total
st = standar deviasi dari skor total
p = proporsi peserta didik yang menjawab betul (banyaknya peserta didik yang
menjawab betul dibagi dengan jumlah seluruh peserta didik )
q = proporsi peserta didik yang menjawab salah (q = 1 – p)

Tabel 3. Cara menghitung Validitas Butir Instrumen Dengan Korelasi Point Biserial
Nomor Butir s Skor
Responden
1 2 3 4 5 6 7 8 9 10 total
A 1 0 1 0 1 1 1 1 1 1 8
B 0 0 1 0 1 0 0 1 1 1 5
C 0 1 0 0 0 1 0 1 0 1 4
D 1 1 0 0 1 1 0 0 1 0 5
E 1 1 1 1 1 1 0 0 0 0 6
F 1 0 1 0 1 0 1 0 0 0 4
G 1 1 1 1 1 1 1 0 0 0 7
H 0 1 0 1 1 1 1 1 1 1 8
p 0,625 0,625 0,625 0,375 0,875 0,75 0,50 0,50 0,50 0,50
q 0,375 0,375 0,375 0,625 0,125 0,25 0,50 0,50 0,50 0,50

Misalnya akan diuji validitas butir soal nomor 6, maka perhitungannya sebagai berikut.
a. mencari 𝑀𝑝 = (8 + 4 + 5 + 6 + 7 + 8) ∶ 6 = 38: 6 = 𝟔, 𝟑𝟑
b. mencari 𝑀𝑡 = (8 + 5 + 4 + 5 + 6 + 4 + 7 + 8) = 47: 8 = 𝟓, 𝟖𝟕𝟓
c. harga standar deviasi dapat dihitung dengan kalkulator atau dengan rumus
berikut:

𝑛 ∑ 𝑋 2 − (∑ 𝑋)2 8𝑥295 − 472


𝑠𝑡 = √ =√ = 1,642
𝑛(𝑛 − 1) 8(8 − 1)

d. menentukan harga p, yaitu 6: 8 = 0,75


e. menentukan harga q , yaitu 2: 8 = 0,25
f. memasukkan ke dalam rumus:
𝑀𝑝 −𝑀𝑡 𝑝 6,33−5,875 0,75
𝑟𝑝𝑏𝑖 = √𝑞 = √0,25 = 0,480
𝑆𝑡 1,642
Perhitungan validitas dengan korelasi produk moment dan korelasi point biserial, hampir
sama hasilnya. Namun demikian, jika datanya berbentuk dikotomi, sebaiknya
menggunakan teknik korelasi point biserial.

2. Menganalisis Reliabilitas Instrumen (Keajegan, Keterandalan)


a. Metode tes paralel (setara) yang mempunyai kesamaan tujuan, tingkat kesukaran
dan susunan tetapi butir-butir soal berbeda.
b. Metode tes ulang (test-retest)
Satu perangkat tes diberikan dua kali kepada testee yang sama pada waktu hampir
bersamaan, kemudian hasilnya dikorelasikan.
c. Rumus Kuder Richadson 20 (KR-20)
KR-20 ini secara khusus untuk menghitung reliabilitas tes yang datanya dikotomi.
Rumus KR-20:
𝑘 𝑆𝐷𝑡2 −∑ 𝑝𝑞
𝑟1.1 = ( )( )
𝑘−1 𝑆𝐷𝑡2

Keterangan :
r1.1 = koefisien reliabilitas tes
p = proporsi testee yang menjawab betul
q = proporsi testee yang menjawab salah
n = banyaknya testee
SD2t = varian total tes
pq = p x q
k = banyak butir tes
Jika taraf kesulitan butir tes homogen, digunakan KR – 21, dengan rumus sebagai
berikut.
Rumus KR-21:
𝑘 𝑀(𝑘 − 𝑀)
𝑟1.1 = ( ) (1 − )
𝑘−1 𝑘. 𝑆𝐷𝑡2
Keterangan:
r1.1 = reliabilitas tes
M = rata-rata hitung
k = banyak butir
SD2t = varian total tes

Untuk menghitung reliabilitas tes dengan rumus KR-20, berikut ini disertakan tabel
data fiktif. Terlebih dahulu harus dihitung simpangan bakunya (standar deviasi),
kemudian variansnya, p (proporsi jawaban benar), dan q (1 – p). Berdasarkan hasil
perhitungan tersebut, kemudian dimasukkan ke dalam rumus KR-20.
Tabel 4. Cara Menghitung Reliabilitas dengan KR-20
Butir
Subjek 1 2 3 4 5 6 7 8 Total X (X)2

1 1 1 1 1 1 1 1 0 7 49
2 1 0 1 0 1 0 1 1 5 25
3 1 0 1 0 0 0 1 0 3 9
4 1 1 1 1 1 1 1 1 8 64
5 1 0 1 0 1 1 1 0 5 25
6 0 0 0 0 0 0 0 1 1 1
7 1 0 0 0 0 0 0 0 1 1
8 0 1 1 0 0 0 0 1 3 9
9 1 1 0 0 0 0 0 1 3 9
10 1 1 0 0 0 0 0 1 3 9
p 0,8 0,5 0,7 0,3 0,4 0,3 0,5 0,5 39 201
q 0,2 0,5 0,3 0,7 0,6 0,7 0,5 0,5 - -
pq 0,16 0,25 0,21 0,21 0,24 0,21 0,25 0,25 1,78 ∑pq

𝑛 ∑ 𝑋 2 − (∑ 𝑋)2 10𝑥201 − 392


𝑆𝐷 = √ =√ = 2,33
𝑛(𝑛 − 1) 10(10 − 1)

𝑆𝐷2 = (2,33)2 = 5,43


𝑘 𝑆𝐷𝑡2 − ∑ 𝑝𝑞
𝑟1.1 =( )( )
𝑘−1 𝑆𝐷𝑡2
8 5,43 − 1,78
𝑟1.1 = ( )( )
8−1 5,43
𝑟1.1 = 𝟎, 𝟕𝟔𝟖

d. Koefisien Alpha-Cronbach
Jika datanya berbentuk politomi, digunakan rumus Alpha-Cronbach.
Rumus Alpha-Cronbach:
𝑘 𝑆𝐷𝑡2 − ∑ 𝑆𝐷𝑖2
𝑟1.1 =( )( )
𝑘−1 𝑆𝐷𝑡2
Keterangan :
r1.1 = koefisien reliabilitas perangkat tes
k = banyak butir tes
SDi2 = varians skor tiap butir (item)
2
SDtot = varian skor total

Tabel 5. Cara Menghitung Reliabilitas dengan Koefisien Alpha-Cronbach


Butir
1 2 3 4 5 Skor total (X) Skor X2
Subjek
1 6 6 7 2 7 28 784
2 4 0 5 4 2 15 225
3 6 7 5 6 4 28 784
4 4 4 2 4 7 21 441
5 3 2 0 4 4 13 169
6 6 7 2 5 2 22 484
7 6 3 7 3 7 26 676
8 8 4 5 5 3 25 625
9 7 6 6 9 5 33 1089
10 5 4 7 8 6 30 900
Total 55 43 46 50 47 241 6177
∑X2 323 231 266 292 257 (∑X) (∑X2)
SD 1,43 2,15 2,33 2,05 1,9
SD2 2,05 4,62 4,43 4,2 3,61 Total 18,91

Diketahui :
𝑘=5
∑ 𝑆𝐷𝑖2 = 18,91 (diperoleh dari jumlah SD2 tiap butir tes)
𝑆𝐷𝑡2 = 40,99 (diperoleh dari perhitungan berikut):

𝑛 ∑ 𝑋 2 − (∑ 𝑋)2 10𝑥6177 − 2412


𝑆𝐷𝑡𝑜𝑡 = √ =√ = 6,40
𝑛(𝑛 − 1) 10(10 − 1)

𝑆𝐷𝑡2 = 𝟒𝟎, 𝟗𝟗
𝑘 𝑆𝐷𝑡2 − ∑ 𝑆𝐷𝑖2 5 6,42 − 18,91
𝑟1.1 =( )( )=( )( )
𝑘−1 𝑆𝐷𝑡2 5−1 6,42
𝑟1.1 = 0,67
Berdasarkan perhitungan di atas, dengan memasukkan ke rumus koefisien Alpha-
Cronbach, diperoleh reliabilitas r1.1 = 0,67. Untuk menentukan derajat reliabilitas tes,
dapat digunakan kriteria sebagai berikut.
≤ 0,20 : sangat rendah
0,20 ≤ 0,40 : rendah
0,40 ≤ 0,60 : sedang
0,60 ≤ 0,80 : tinggi
0,80 ≤ 1,00 : sangat tinggi

3. Cara Menghitung Tingkat Kesukaran Tes (P)


Tingkat kesukaran butir tes merupakan bilangan yang menunjukkan proporsi peserta
ujian (testee) yang dapat menjawab betul butir soal tersebut. Sedangkan tingkat
kesukaran perangkat tes adalah bilangan yang menunjukkan rata-rata proporsi testee
yang dapat menjawab seluruh (perangkat) tes tersebut.
Rumus Tingkat Kesukaran :
∑𝑃
𝑃𝑝 =
𝑛
Keterangan :
Pp = tingkat kesukaran perangkat tes
P = tingkat kesukaran tiap butir
N = banyaknya butir tes

Tingkat kesukaran tiap butir, dihitung dengan Rumus :


𝑛𝐵
𝑃=
𝑛
Keterangan : P = tingkat kesukaran butir tes
nB = banyaknya subyek yang menjawab soal dengan betul
n = jumlah subyek (testee) seluruhnya

Kriteria tingkat kesukaran (P) :


0,00 – 0,29 = sukar
0,30 – 0,70 = sedang*
0,71 – 1,00 = mudah
Tes yang baik adalah tes yang memiliki taraf kesukaran antara 0,25 – 0,75.
4. Daya Beda Tes (D)
Daya beda butir tes ialah kemampuan butir tes tersebut membedakan antara
testee kelompok atas (pinter) dan testee kelompok bawah (lemah). Daya beda perangkat
tes adalah rata-rata kemampuan tiap butir tes membedakan antara testee kelompok atas
(pinter) dan testee kelompok bawah (lemah). Rumus untuk menghitung tingkat daya beda
tes adalah sebagai berikut.
Rumus tingkat daya beda :
∑(𝑃𝐴 − 𝑃𝐵 )
𝐷𝐵 =
𝑛
DB = Daya beda tes
n = jumlah butir tes

Rumus untuk menghitung daya beda butir tes adalah sebagai berikut :
𝑛𝐵𝐴 𝑛𝐵𝐵
𝐷𝐵 = − atau 𝐷𝐵 = 𝑃𝐴 − 𝑃𝐵
𝑛𝐴 𝑛𝐵

Keterangan:
nBA = jumlah subyek yang menjawab betul pada kelompok atas
nBB = jumlah subyek yang menjawab betul pada kelompok bawah
nA = jumlah subyek kelompok atas
nB = jumlah subyek kelompok bawah

Kriteria Daya Beda (D) :


0,00 – 0,19 = kurang baik
0,20 – 0,39 = cukup baik
0,40 – 0,70 = baik
0,71 – 1,00 = sangat baik
* Jika “D” negatif, soal tersebut sangat buruk dan harus dibuang.

5. Analisis Pengecoh (distractor)


Pengecoh yang baik (efektif) ialah pengecoh yang dipilih oleh minimal 2-3% dari pengikut
tes. Berikut diberikan contoh cara menghitung efektifitas pengecoh untuk 1 butir tes
objektif yang memiliki 4 option a,b,c, dan d.
Pilihan A* B C D *kunci
Kelompok atas 5 4 0 1 10
Kelompok bawah 3 3 0 4 10
Jumlah 8 7 0 5 20

Kunci jawaban betul untuk soal di atas adalah pilihan jawaban (A). Pilihan jawaban b, c,
dan d sebagai pengecoh. Pada umumnya sebuah pengecoh yang baik dapat
mengundang jawaban lebih besar jumlahnya pada peserta didik kelompok lemah, dan
lebih sedikit pada kelompok pandai. Pilihan jawaban b, sebagai pengecoh tidak efektif,
sebab menarik jawaban lebih banyak dari kelompok peserta didik pandai. Kejadian itu
disebabkan karena distractor (b) membingungkan. Pilihan jawaban c sama sekali tidak
efektif, karena tidak dapat menarik jawaban seorangpun. Pilihan jawaban d dipandang
telah memenuhi fungsinya, sebab dapat mengundang jawaban oleh peserta didik
kelompok pandai yang lebih sedikit.
TABEL
NILAI-NILAI r PRODUCT MOMENT

Taraf Signif Taraf Signif Taraf Signif


N N N
5% 1% 5% 1% 5% 1%
3 0,997 0,999 27 0,381 0,487 55 0,266 0,345
4 0,950 0,990 28 0,374 0,478 60 0,254 0,330
5 0,878 0,959 29 0,367 0,470 65 0,244 0,317

6 0,811 0,917 30 0,361 0,463 70 0,235 0,306


7 0,754 0,874 31 0,355 0,456 75 0,227 0,296
8 0,707 0,834 32 0,349 0,449 80 0,220 0,286
9 0,666 0,798 33 0,344 0,442 85 0,213 0,278
10 0,632 0,765 34 0,339 0,436 90 0,207 0,270

11 0,602 0,735 35 0,334 0,430 95 0,202 0,263


12 0,576 0,708 36 0,329 0,424 10C 0,195 0,250
13 0,553 0,684 37 0,325 0,418 125 0,176 0,230
14 0,532 0,661 38 0,320 0,413 150 0,159 0,210
15 0,514 0,641 39 0,316 0,408 175 0,148 0,194

16 0,497 0,623 40 0,312 0,403 200 0,138 0,181


17 0,482 0,606 41 0,308 0,398 300 0,113 0,148
18 0,468 0,590 42 0,304 0,393 400 0,098 0,128
19 0,456 0,575 43 0,301 0,389 500 0,088 0,115
20 0444 0,561 44 0,297 0,384 600 0,080 0,105

21 0,433 0,549 45 0,294 0,380 700 0,074 0,097


22 0,423 0,537 46 0,291 0,376 800 0,070 0,091
23 0,413 0,526 47 0,288 0,372 900 0,065 0,086
24 0,404 0,515 48 0,284 0,368 1000 0,062 0,081
25 0,396 0,505 49 0,281 0,364
26 0,388 0,496 50 0,279 0,361
TUGAS

Você também pode gostar