ANALISIS SENTIMEN TERHADAP BAKAL CALON PRESIDEN 2024 DENGAN ALGORITMA MULTINOMIAL NAÏVE BAYES DAN OVERSAMPLING SMOTE

  • Hary Permana Informatika, Universitas Jenderal Achmad Yani
  • Yulison Herry Chrisnanto Informatika, Universitas Jenderal Achmad Yani
  • Herdi Ashaury Informatika, Universitas Jenderal Achmad Yani

Abstrak

Pemilihan presiden 2024 menjadi salah satu bahasan yang ramai dibicarakan oleh masyarakat Indonesia, khususnya di media sosial Twitter. Pengguna Twitter menuliskan opini mereka melalui tweet terhadap bakal calon presiden yang akan maju pada pilpres 2024 nanti. Dari opini tersebut dapat dilakukan penelitian untuk mengetahui sentimen masyarakat Indonesia terhadap tokoh bakal calon presiden 2024 dengan melakukan analisis sentimen. Salah satu algoritma yang dapat digunakan untuk melakukan analisis sentimen adalah Multinomial Naïve Bayes, algoritma ini menunjukkan performa yang baik dalam melakukan analisis sentimen. Namun, dalam melakukan analisis sentimen biasanya terdapat masalah pada ketidakseimbangan kelas. Untuk mengatasi hal tersebut, penelitian ini menggunakan teknik oversampling SMOTE untuk menyeimbangkan kelasnya. Pengumpulan data dilakukan dengan crawling data tweets menggunakan library snscrape. Selanjutnya, tahapan preprocessing dilakukan untuk menghilangkan kata yang duplikat dan tidak relevan. Karena data tweets tidak mempunyai label maka akan dilakukan pelabelan menggunakan lexicon InSet. Setelah itu dilakukan ekstraksi fitur menggunakan Term Frequency-Inverse Document Frequency (TF-IDF) dengan nilai 1-gram dan 2-gram. Hasilnya menunjukkan penggunaan oversampling SMOTE dapat meningkatkan performa klasifikasi ketika kelas data tidak seimbang, yang ditunjukkan dengan adanya peningkatan performa berkisar antara 6-20% pada setiap dataset.

##plugins.generic.usageStats.downloads##

##plugins.generic.usageStats.noStats##
Diterbitkan
2024-01-20