Escolar Documentos
Profissional Documentos
Cultura Documentos
ABSTRAK
Pada binerisasi dokumen, variasi intensitas lokal sering muncul dan merupakan akibat dari berbagai
faktor seperti pencahayaan yang tidak merata, noise, dan tekstur dari kertas. Salah satu cara untuk mengatasi
permasalahan tersebut adalah dengan metode local thresholding berdasarkan informasi bentuk. Akan tetapi
proses komputasi yang lama diperlukan pada metode local thresholding citra dokumen yang memanfaatkan
informasi bentuk. Hal ini disebabkan, setiap local window akan ditentukan nilai threshold-nya berdasarkan
informasi bentuk. Paper ini mengusulkan penggabungan metode global thresholding dan local thresholding
berdasarkan bentuk. Sehingga didapatkan kualitas thresholding yang lebih baik dengan proses komputasi yang
lebih cepat. Pada local window yang memiliki intensitas rendah akan dilakukan proses thresholding secara
global, sedangkan local window yang memiliki intensitas tinggi dilakukan local thresholding berdasarkan
bentuk. Dari hasil uji coba didapatkan kualitas thresholding yang lebih baik dengan proses komputasi yang
lebih cepat. Rata-rata keakuratan thresholding yang dicapai adalah 96,42%.
26
Fanani, Prima & Hidayat, Local Thresholding Berdasarkan Bentuk Untuk Binerisasi Citra Dokumen
27
Volume 10, Nomor 1, Januari 2012: 26-31
Langkah pertama yang dilakukan terhadap citra dokumen. n adalah jumlah pixel dalam local
dokumen yang telah terbagi menjadi beberapa local window, dan K adalah kernel Gaussian. w adalah
window adalah menghitung nilai standar deviasi hasil ukuran smoothing dari local window yang
lokal seperi pada Gambar 4. Jika nilai standar didapat dari persamaan (2), dimana σ adalah standar
deviasi lokal lebih rendah daripada standar deviasi deviasi dan IQR merupakan nilai intensitas citra
global maka local window tersebut di-threshold dokumen pada local window.
menggunakan metode Otsu. Jika sebaliknya, proses
thresholding dilakukan dengan metode local ,
thresholding berdasarkan bentuk. . (2)
2.4 Thresholding berdasarkan Bentuk
Untuk setiap local window, sebuah kandidat Setelah intensitas histogram dihasilkan, lembah
nilai threshold dihasilkan oleh analisis sederhana dari (minimum) yang ditemukan akan dianggap sebagai
intensitas histogram citra. Lembah yang dominan kandidat nilai thershold. Untuk setiap kandidat nilai
dipilih sebagai calon nilai threshold [3]. Untuk threshold , histogram pada local window
menghindari lembah yang tidak dominan akibat dihitung kemiripannya dengan histogram sampling.
noise, maka perlu dilakukan proses smoothing yang Bhattacharyya Coefficient (BC) [7] digunakan
diterapkan dalam analisis intensitas histogram. untuk mengukur kemiripan antara histogram
Metode estimasi Probability Density Function [4] hsampling dan histogram test h(t). Semua histogram
diadopsi untuk mengatasi permasalahan tersebut. dinormalisasi. BC digunakan untuk mengevaluasi
Metode ini secara otomatis menghasilkan distribusi derajat kedekatan dari dua probability density
kontinyu dari data histogram diskrit. Probability function. Diantara semua kandidat nilai threshold
Density Function ditentukan dengan metode yang dihasilkan dari satu local window, kandidat
Silverman [6]: nilai threshold yang menghasilkan nilai BC yang
maksimum akan dipilih sebagai nilai threshold pada
local window, yaitu:
(1)
(3)
dimana dalam kasus ini adalah nilai intensitas
piksel dalam sebuah local window dari citra
a b c
d e f
g h i
Gambar 4. Penentuan metode threshold dengan standar deviasi global 0.50043,
(a) standar deviasi 0.50129, (b) standar deviasi 0.50124, (c) standar deviasi 0.50129,
(d) standar deviasi 0.48348, (e) standar deviasi 0.50129, (f) standar deviasi 0.50129,
(g) standar deviasi0.43487, (h) standar deviasi 0.50128, (i) standar deviasi 0.47613
28
Fanani, Prima & Hidayat, Local Thresholding Berdasarkan Bentuk Untuk Binerisasi Citra Dokumen
2.5 Penggabungan Local Window komputasi metode semakin cepat. Hasil pengujian
Setelah mendapatkan nilai local threshold yang kedua metode tersebut dapat dilihat pada Tabel 1.
optimum untuk setiap local window, tahap terakhir Hasil thresholding pada citra 1, 2 dan 5 dengan
dari metode yang diusulkan adalah menggabungkan menggunakan metode yang diusulkan menghasilkan
local window tersebut untuk mendapatkan citra nilai ME relatif lebih besar dibandingkan dengan
dokumen yang utuh. Seperti yang terlihat pada metode Jichuan. Hal ini terjadi karena karakteristik
Gambar 5. citra dokumen 1, 2 dan 5 memiliki jenis font yang
sama. Pada metode yang diusulkan tidak semua local
3 UJI COBA DAN PEMBAHASAN window di-threshold menggunakan thresholding
berdasarkan bentuk. Sedangkan pada metode Jichuan
Pada tahap uji coba, dataset yang digunakan semua local window di-threshold dengan
berisi citra dokumen yang terdiri dari citra dokumen thresholding berdasarkan bentuk.
tulisan tangan dan citra dokumen tulisan cetak. Pada Pada citra 1, 2 dan 5, selisih ME antara metode
masing-masing citra dokumen terdapat sebuah yang diusulkan dengan metode Jichuan relatif kecil,
ground truth dan citra dokumen terdegradasi, yang yaitu sebesar 0.55, 1.01, dan 0.04. Akan tetapi jika
akan diuji dengan metode thresholding yang dilihat dari kompleksitas komputasi antara metode
diusulkan. Jichuan dan metode yang diusulkan terhadap citra 1
Dalam pengujian digunakan lima citra dokumen dan 2, metode yang diusulkan lebih rendah dalam
seperti yang ditunjukkan pada Gambar 6. Untuk kompleksitas komputasi. Sementara pada citra 5,
mengevaluasi performa dari algoritma yang kedua metode memiliki kompleksitas komputasi
diusulkan, metode yang diusulkan akan yang sama dengan selisih ME sebesar 0.04.
dibandingkan dengan metode Jichuan [4]. Uji coba Hasil thresholding pada citra 3 dan 4, nilai ME
perbandingan metode dilakukan untuk mengetahui metode yang diusulkan jauh lebih kecil dari metode
seberapa unggul metode local thresholding Jichuan. Hal ini terjadi karena pada citra 3 dan 4
berdasarkan bentuk yang diusulkan dibandingkan terdapat perbedaan jenis dan ketebalan font.
dengan metode yang telah dikembangkan Jichuan. Perbedaan jenis dan ketebalan font mengakibatkan
Citra dokumen hasil thresholding metode yang performa thresholding berdasarkan bentuk menurun.
diusulkan dapat dilihat pada Gambar 7, sedangkan Karena pada metode yang diusulkan tidak semua
citra dokumen hasil thresholding metode Jichuan local window di-threshold berdasarkan bentuk maka
dapat dilihat pada Gambar 8. hasilnya jauh lebih baik.
Kualitas secara kuantitas dari thresholding citra
dokumen juga dievaluasi menggunakan dua metode Tabel 1. Evaluasi Kinerja Metode yang diusulkan
yaitu, misclassification error (ME) dan peak signal dan Metode Jichuan
to noise ratio (PSNR). ME didefinisikan sebagai Metode
Evaluasi Citra Jichuan
hubungan antara citra dokumen hasil thresholding diusulkan
dengan ground truth. ME secara sederhana PSNR 1 43.90 43.54
diformulasikan sebagai berikut:
2 50.68 42.01
3 38.92 46.50
, (4)
4 32.87 48.68
dimana background dan foreground untuk ground 5 38.12 37.39
truth dinotasikan dan , sedangkan dan ME 1 1.18 1.73
merupakan background dan foreground hasil 2 1.05 2.06
thresholding citra dokumen. Semakin kecil nilai ME
3 8.00 3.38
menunjukkan bahwa hasil thresholding citra
dokumen semakin baik. 4 8.40 4.34
Selain ME untuk mengukur kualitas hasil 5 6.35 6.39
thresholding citra dokumen digunakan Peak signal to
Kompleksitas 1 6 5
noise ratio (PSNR). Semakin tinggi nilai PSNR
menunjukkan bahwa hasil thresholding citra Komputasi 2 9 6
dokumen semakin baik. 3 2 2
Untuk mengetahui kompleksitas komputasi dari 4 6 2
metode yang diusulkan, dapat dilihat dari jumlah
penggunaan local thresholding berdasarkan bentuk. 5 5 5
Semakin sedikit penggunaan local thresholding NB : Nilai dengan font yang ditebalkan menunjukkan hasil yang
berdasarkan bentuk, menunjukkan kompleksitas lebih baik
29
Volume 10, Nomor 1, Januari 2012: 26-31
a b a b
c c
d
d
e
e
Gambar 8. Hasil Thresholding Citra Uji Metode
Gambar 6. Citra Dokumen Asli a. Citra 1, b. Citra 2,
Jichuan. Citra 1, b. Citra 2, c. Citra 3, d. Citra 4,
c. Citra 3, d. Citra 4, e. Citra 5
e. Citra 5
4 KESIMPULAN
Dari hasil uji coba dapat diambil kesimpulan
c d sebagai berikut :
1. Metode yang diusulkan dapat melakukan
proses thresholding lokal berdasarkan
bentuk terhadap citra dokumen dengan baik,
sehingga menghasilkan citra yang dapat
dikenali secara visual.
2. Rata-rata akurasi dari metode yang
diusulkan mencapai 96,42% dengan rata-
e rata jumlah local window yang di-threshold
Gambar 7. Hasil Thresholding Citra Uji Metode menggunakan local thresholding
yang diusulkan. Citra 1, b. Citra 2, c. Citra 3, d. Citra berdasarkan bentuk sebanyak 4. Sedangkan
pada metode jichuan rata-rata jumlah local
4, e. Citra 5
window yang menggunakan local
thresholding berdasarkan bentuk sebanyak
Untuk kompleksitas komputasi pada citra 4 5,6. Hal ini menunjukkan metode yang
metode yang diusulkan lebih rendah sementara pada diusulkan memiliki waktu komputasi yang
citra 3 dengan kompleksitas komputasi yang sama lebih rendah daripada metode sebelumnya.
nilai ME metode yang diusulkan lebih baik sebesar
4,62. Dari Tabel 1 terlihat bahwa kompleksitas
komputasi metode yang diusulkan lebih rendah dari
30
Fanani, Prima & Hidayat, Local Thresholding Berdasarkan Bentuk Untuk Binerisasi Citra Dokumen
31