PERBANDINGAN ALGORITME-ALGORITME PEMBELAJARAN MESIN PADA KLASIFIKASI SMS SPAM

  • Edi Zuviyanto Departemen Teknik Elektro dan Teknologi Informasi FT UGM
  • Teguh Bharata Adji Departemen Teknik Elektro dan Teknologi Informasi FT UGM
  • Noor Akhmad Setiawan Departemen Teknik Elektro dan Teknologi Informasi FT UGM
Keywords: Klasifikasi, SMS spam, Naive bayes classifier, Support vector machine, C4.5, KNN

Abstract

Short Message Service (SMS) merupakan salah satu media komunikasi yang termurah. Dengan murahnya tarif layanan SMS, membuat pihak-pihak yang tidak bertanggungjawab menggunakannya untuk kepentingan bisnis dan tindak kejahatan. Hal ini, menyebabkan kerugian bagi masyarakat yang menggunakan layanan SMS. Oleh karena itu, diperlukan teknik klasifikasi teks untuk membedakan pesan SMS yang berisi spam dan bukan spam (ham). Beberapa penelitian sudah dilakukan untuk mengklasifikasikan SMS spam dan ham. Namun, belum ditemukan algoritme klasifikasi yang baik untuk klasifikasi SMS spam. Penelitian ini bertujuan untuk mencari algoritme klasifikasi yang baik untuk klasifikasi SMS spam dengan membandingkan beberapa algoritme klasifikasi machine learning. Beberapa algoritme tersebut yaitu C4.5, KNN, NBC, dan SVM. Penelitian dilakukan dengan beberapa langkah yaitu pengumpulan data, preprocessing, pembobotan fitur, klasifikasi, evaluasi dan perbandingan akurasi. Hasilnya, pengujian klasifikasi SMS dengan menggunakan algoritme SVM memiliki tingkat akurasi lebih baik daripada menggunakan algoritme C4.5, KNN maupun NBC. Nilai akurasi yang diperoleh dengan menggunakan metode SVM sebesar 94,60%, sedangkan nilai akurasi dengan menggunakan metode C4.5, KNN dan NBC berturut-turut sebesar 85,86%, 77,50% dan 86,10 %.

Downloads

Download data is not yet available.
Published
2018-02-03