PENERAPAN TEKNIK RANDOM OVERSAMPLING UNTUK MENGATASI IMBALANCE CLASS DALAM KLASIFIKASI WEBSITE PHISHING MENGGUNAKAN ALGORITMA LIGHTGBM

  • Sri Diantika Universitas Bina Sarana Informatika

Abstract

Kemudahan mendapatkan Segala informasi dari website, membuat masyarakat lebih memilih website sebagai sarana mencari sebuah informasi yang cepat. maraknya penggunaan website, membuat beberapa oknum yang tidak bertanggungjawab menyalahgunakan penggunaan website, seperti melakukan penipuan atau phishingPhishing menjadi salah satu kejahatan siber yang memiliki sifat mengancam serta menjebak user dengan cara memancing user atau pengguna untuk secara tidak langsung memberikan suatu informasi kepada pelaku phishing. Dari permasalahan tersebut peneliti melakukan penelitian menggunakan dataset publik dari Kaggle yang berisi kumpulan URL situs web berjumlah lebih dari 11000 situs web. Peneliti mengusulkan model untuk mengklasifikasikan website phishing dan non phishing menggunakan lightGBM. Kami juga menerapkan Random Over Sampling (ROS) pada data untuk mengatasi masalah ketidakseimbangan kelas pada data. Eksperimen kami menunjukkan bahwa metode yang diusulkan mencapai akurasi sebesar 96,9%,  recall 96,9%, , F1-Score 96,9%, dan nilai ROC 99,7%. Ini secara signifikan lebih baik daripada beberapa metode lain

Downloads

Download data is not yet available.
Published
2023-01-16