ALGORITMA XGBOOST UNTUK KLASIFIKASI KUALITAS AIR MINUM

  • Muhammad Dava Maulana Informatika, Universitas Jenderal Achmad Yani
  • Asep Id Hadiana Informatika, Universitas Jenderal Achmad Yani
  • Fajri Rakhmat Umbara Informatika, Universitas Jenderal Achmad Yani
Keywords: Air, Data Mining, Klasifikasi, XGBoost, Confusion Matrix

Abstract

Air adalah sumber daya alam yang penting bagi keberlangsungan hidup organisme di bumi, termasuk manusia, hewan, dan tumbuhan. Namun, potensi tercemarnya air oleh bakteri dan zat mineral berbahaya mengancam kesehatan manusia. Penyebab utama tercemarnya air meliputi aktivitas manusia yang intens, proses industri kompleks, dan kurangnya kesadaran akan dampak limbah yang dibuang sembarangan ke perairan. Kualitas air bisa diukur dengan berbagai parameter, dan pendekatan machine learning dapat digunakan untuk klasifikasi kualitas air. Salah satu metode yang efektif adalah XGBoost, sebuah varian gradient tree boosting yang mampu meningkatkan akurasi prediksi dengan mengurangi overfitting. Penelitian sebelumnya telah menunjukkan bahwa XGBoost memiliki performa yang baik dalam klasifikasi, bahkan mengungguli beberapa algoritma lain seperti Naïve Bayes dan Random Forest dalam konteks tertentu. Penelitian ini juga bertujuan untuk mengukur akurasi algoritma XGBoost dalam melakukan klasifikasi kualitas air. Hasil percobaan menunjukan dengan dataset sebanyak 2400 dengan pembagian data latih 80% dan data uji 20%, yang terdiri dari 1200 data kelas dapat diminum dan 1200 data kelas tidak dapat diminum. Akurasi yang didapat adalah 82.29%, precision 78.62%, recall 85.90% dan f1-score 82.09%.

Downloads

Download data is not yet available.
Published
2024-01-20