|
Pengolahan Citra sesi (Optical Character Recogniton) |
|
|
|
|
Written by Topx
|
|
Tuesday, 19 June 2007 |
|
Metodologi OCR (Optical Character Recogniton) Langkah awal dalam metodologi Optical Character Recogniton adalah adanya input berupa documen document. Ini di jadikan sebagai masukan untuk proses selanjutnya. Kemudian proses berlanjut untuk mengubah inputan tersebut menjadi data digital dengan bantuan optical scanner setelah digitalization terselesaikan. Kemudian masukan berupa dokumen teks, perlu cropping lokasi-lokasi karakter yang akan dikenali untuk locating character dengan simulasi character matrix. Image Preprocessing – proses yang dibutuhkan adalah deteksi sisi dan thinning atau skeletonizing untuk mendapatkan obyek karakter dengan ketebalan 1 piksel, proses sizesing berorientasi untuk mencapai noise cleaning yang diinginkan.feature extractor dilakukan untuk ekstraksi ciri karakter, misal perhitungan ciri moment atau ciri lainnya, sehingga proses matching yang diinginkan sesuai.decision maker atau pengambilan keputusan karakter apakah itu dengan membandingkan ciri karakter tersebut dengan knowledge base yang menyimpan ciri-ciri setiap karakter yang dibangun dalam tahap pelatihan sehingga character identification dapat terlaksana dengan baik untuk mencapai recognitized character atau merupakan hasil pengenalan karakter dari input dokument.
|