PERBANDINGAN METODE LINEAR REGRESSION, RANDOM FOREST & K-NEAREST NEIGHBOR UNTUK PREDIKSI PRODUKSI HASIL PANEN PADI DI PROVINSI JAWA BARAT

  • Jonatan Hutahaean Informatika, Universitas Singaperbangsa Karawang
  • Dadang Yusup Informatika, Universitas Singaperbangsa Karawang
  • Purwantoro Purwantoro Informatika, Universitas Singaperbangsa Karawang
Keywords: linear regression, random forest, k-nearest neighbor, panen padi

Abstract

Padi merupakan bahan utama beras yang termasuk salah satu bahan pokok terbesar di dunia. Indonesia berada di peringkat ketiga sebagai produsen beras terbesar di dunia, setelah Tiongkok dan India. Provinsi Jawa Barat secara konsisten berada dalam tiga besar penghasil padi nasional. Meskipun selalu berada dalam tiga besar, produksi padi di Jawa Barat mengalami penurunan setiap tahun. Produksi padi sangat berpengaruh terhadap pemenuhan kebutuhan pangan pokok berupa beras, karena permintaan beras meningkat setiap tahun. Produksi padi dapat meningkat atau menurun karena beberapa faktor, seperti luas areal tanam, luas panen, dan produktivitas padi. Pada penelitian ini, digunakan teknik regresi untuk memprediksi produksi hasil panen padi di Provinsi Jawa Barat menggunakan metode linear regression, random forest, dan k-nearest neighbor. Perbandingan yang dihasilkan dilihat dari R2-score, mean absolute error, dan mean squared error. Pada perbandingan metode, digunakan skenario yang sama, yaitu cross-validation 10-fold. Hasil uji coba dengan menggunakan skenario yang sama menunjukkan bahwa ketiga metode dapat digunakan untuk memprediksi produksi hasil panen padi di Provinsi Jawa Barat. Kesimpulan dari penelitian ini menujukkan bahwa metode linear regression memiliki performa lebih baik daripada metode random forest dan k-nearest neighbor dengan R2-score 98,33, MAE 27746,46, dan MSE 1688264771,87.

Downloads

Download data is not yet available.
Published
2024-06-18