ALGORITMA DECISION TREE C4.5 DIGUNAKAN UNTUK MENGKLASIFIKASIKAN DATA STROKE
Abstract
Tujuan utama dari penelitian ini adalah untuk menggunakan algoritma pohon keputusan atau Decision Tree C4.5 untuk mengkategorikan data stroke. Upaya penelitian khusus ini dimotivasi oleh masalah mendesak dari tingkat kejadian yang mengkhawatirkan terkait dengan stroke, akibat perlu prediksi yang tepat dari faktor risiko stroke. Dataset yang digunakan untuk penelitian ini diperoleh dari situs web data publik dan platform terkenal www.kaggle.com, yang mencakup total 11 variabel. Metodologi penelitian yang digunakan dalam penyelidikan ini mencakup beberapa langkah integral, termasuk pengumpulan data, pra-pemrosesan data, transformasi data, pemodelan penambangan data dengan algoritma Pohon Keputusan C4.5, dan, terakhir, evaluasi model. Temuan fase evaluasi mengungkapkan tingkat akurasi yang mengesankan 93,64%, dengan nilai presisi 12,50% untuk prediksi stroke positif dan 95,26% untuk prediksi stroke negatif. Namun, penting untuk menyoroti bahwa meskipun tingkat akurasi tinggi dicapai, nilai presisi dan penarikan untuk kasus stroke positif masih relatif rendah, sehingga memerlukan peningkatan dan penyempurnaan model. Secara keseluruhan, analisis komprehensif dan hasil penelitian ini sangat menyiratkan bahwa algoritma Pohon Keputusan C4.5 menunjukkan potensi yang signifikan untuk klasifikasi awal penyakit stroke.