OPTICAL CHARACTER RECOGNITION MENGGUNAKAN SELF ORGANIZING MAP

  • Ali Ali Teknik Informatika, Institut Teknologi Nasional Malang
Keywords: Optical Character Recognition, Self Organizing Map, Jaringan Syaraf Tiruan Kohonen, Android, Connected Component Labelling, Clustering

Abstract

Pengenalan karakter teks secara digital merupakan bagian dari ilmu computer vision. Dalam pengenalan karakter dibutuhkan metode kecerdasan buatan supaya dapat membedakan setiap karakternya. Optical Character Recognition (OCR) merupakan salah satu metode pengenalan karakter cetak dengan menggunakan kecerdasan buatan sehingga teks dapat dikenali dengan beberapa tahapan. Penulis memilih metode Self Organizing Map (SOM) karena menurut penulis metode tersebut dapat diterapkan untuk mengenali karakter dan SOM merupakan salah satu kecerdasan buatan yang tidak membutuhkan pengawasan.
Algoritma Self Organizing Map (SOM) atau yang sering disebut dengan Jaringan Syaraf Tiruan Kohonen merupakan suatu metode jaringan syaraf tiruan yang diperkenalkan oleh Professor Teuvo Kohonen pada tahun 1981. Jaringan Kohonen merupakan salah satu bentuk topologi dari Unsupervised Artificial Neural Network (Unsupervised ANN) di mana dalam proses pelatihannya tidak memerlukan pengawasan (target output). Jaringan Kohonen/SOM digunakan untuk mengelompokkan (clustering) data berdasarkan karakteristik/fitur-fitur data. Penelitian ini menerapkan SOM dalam aplikasi berbasis Android dengan sistem operasi minimum v4.4.2 (KitKat) dan maksimum v5.1 (Lollipop).
Penelitian ini lebih berfokus kepada pengenalan karakter teks. Masukan dalam penelitian ini berupa citra yang diambil dari smartphone. Segmentasi yang digunakan untuk memisahkan obyek dengan latar belakang citra yaitu Connected Component Labeling (CCL). Masukan dalam pengenalan pola SOM berupa 2 buah vektor yang berisi jumlah citra berwarna hitam. Iterasi dilakukan sebanyak 100 kali sehingga hasil akhir clustering merupakan hasil pengenalan karakter. Data training menggunakan jenis font Arial berukuran 14 dengan style tebal (bold) sebanyak masing-masing huruf 3 data. Persentase keberhasilan pengenalan karakter yaitu 42,304 % dengan kecepatan rata-rata pengenalan karakter 3.74 detik/karakter.

Downloads

Download data is not yet available.
Published
2017-02-28