ANALISA TERJADINYA OVERFITTING DAN UNDERFITTING PADA ALGORITMA NAIVE BAYES DAN DECISION TREE DENGAN TEKNIK CROSS VALIDATION

  • Wildan Attariq Firmansyach STMIK IKMI Cirebon
  • Umi Hayati Program Studi Teknik Informatika, STMIK IKMI Cirebon
  • Yudhistira Arie Wijaya Program Studi Teknik Informatika, STMIK IKMI Cirebon
Kata Kunci: Naïve Bayes, Decision Tree, Overfitting, Underfitting, Cross Validation, Phyton

Abstrak

Perkembangan digital dapat meringankan aktivitas manusia dalam menggunakan, serta mengelola informasi. Suatu informasi berdasarkan kumpulan data dengan dilakukannya proses data mining. Banyak masalah yang terjadi pada data mining dikarenakan hasil yang diperoleh dipengaruhi oleh adanya ketidak seimbangan data sehingga terjadinya overfitting dan underfitting biasanya disebabkan oleh data yang berlebihan atau data yang kurang sehingga model yang dihasilkan tidak dapat menangkap pola dari data yang digunakan. Tujuan dari penelitian ini mendapatkan hasil akurasi terbaik melalui perbandingan yang diperoleh supaya tidak terjadinya overfitting dan underfitting dalam hasil akurasi, untuk mengimplementasikan hasil akurasi darimachine learning meningkatkan kepastian dan menunjukan hasil keputusan, menggunakan data sampel Status Kelulusan Siswa SMA Jurusan IPA Jalur SNMPTN Di Indonesia yang dihimpun dari periode tahun 2022, data berjumlah 4.030 data dan 10 atribut. Metode yang digunakan untuk mendapatkan hasil evaluasi terbaik menggunakan algoritma Naïve Bayes dan Decision Tree dengan teknik Cross Validation. Hasil dari penelitian ini yaitu algoritma Naive Bayes mendapatkan skor akurasi sebesar 63%, serta algoritma Decision Tree mendapatkan skor akurasi sebesar 96%, dengan hasil skor akurasi yang diperoleh algoritma terbaik yaitu Decision Tree dengan menggunakan teknikValidasi silang.

##plugins.generic.usageStats.downloads##

##plugins.generic.usageStats.noStats##
Diterbitkan
2023-02-26