KLASIFIKASI TEKS BERITA BERBAHASA INDONESIA MENGGUNAKAN MACHINE LEARNING DAN DEEP LEARNING: STUDI LITERATUR

  • Alfando Alfando Teknik Informatika, Universitas Muhammadiyah Riau
  • Regiolina Hayami Teknik Informatika, Universitas Muhammadiyah Riau

Abstract

Berita merupakan suatu opini aktual yang menarik dan akurat serta dianggap penting bagi sejumlah besar pembaca, pendengar, maupun penonton. Sebuah dokumen berita seringkali mengacu pada lebih dari satu kategori, sehingga perlu menggunakan metode Klasifikasi yang tidak hanya cepat tetapi juga dapat mengelompokkan teks berita menjadi beberapa kategori. Data yang digunakan sudah terlabel dengan kategori-kategori yang relevan. Data yang digunakan berasal dari berbagai sumber berita dalam bahasa Indonesia. Data tersebut kemudian diproses untuk menghasilkan fitur-fitur yang dapat merepresentasikan teks berita secara numerik, seperti penghitungan kata-kata yang muncul pada teks. Beberapa algoritma Machine Learning dan Deep Learning yang digunakan dalam penelitian ini adalah K-Nearest Neighbor (KNN), Multinominal Naive Bayes, Long Short-Term Memory, Multi Layer Perceptron, dan Support Vector Machine (SVM) dan lainnya. Kinerja dari setiap algoritma dievaluasi menggunakan beberapa metrik evaluasi, seperti accuracy, precision, recall, hamming loss dan F1 score. Hasil penelitian menunjukkan bahwa Support Vector Machine (SVM) memberikan kinerja yang terbaik diantara algoritma Machine Learning lainnya dengan nilai accuracy sebesar 94,24%. Sedangkan pada algoritma Deep Learning, Long Short-Term Memory mendapatkan nilai accuracy sebesar 95%.  Klasifikasi multi-label pada teks berita bahasa Indonesia dengan menggunakan Machine Learning dan Deep Learning memiliki potensi untuk diterapkan pada berbagai aplikasi seperti klasifikasi otomatis pada platform berita online atau monitoring isu-isu terkini yang berkaitan dengan topik tertentu

Downloads

Download data is not yet available.
Published
2023-03-23