Perbandingan Algoritma C4.5, Naive Bayes, dan K- Nearest Neighbors untuk Prediksi Penyakit Jantung
Abstract
Heart disease is one of the leading causes of death worldwide, making early detection crucial to reducing fatality risks. This study aims to compare the performance of three classification algorithms, namely C4.5, Naïve Bayes, and K-Nearest Neighbors (KNN), in predicting heart disease. The Heart Failure Prediction Dataset is obtained from Kaggle and the UCI Repository, comprising 1,211 patient records. After preprocessing, the data was split into training and testing sets with a 70:30 ratio. Model performance was evaluated using accuracy, precision, and recall metrics based on the confusion matrix. The results indicate that the C4.5 algorithm achieved the best performance with an accuracy of 81.07%, outperforming Naïve Bayes (79.10%) and KNN (75.68%). C4.5 also demonstrated a higher recall rate in detecting positive heart disease cases, suggesting its effectiveness in handling clinical datasets with characteristics similar to those used in this study. The main contribution of this research is providing a recommendation for utilizing the C4.5 algorithm in developing decision support systems for early heart disease detection. These findings are expected to help improve early diagnostic accuracy and support faster and more accurate medical decision-making.
Penyakit jantung merupakan salah satu penyebab utama kematian di dunia, sehingga deteksi dini menjadi sangat penting untuk mengurangi risiko fatalitas. Penelitian ini bertujuan membandingkan kinerja tiga algoritma klasifikasi, yaitu C4.5, Naïve Bayes, dan K-Nearest Neighbors (KNN), dalam memprediksi penyakit jantung. Dataset yang digunakan adalah Heart Failure Prediction Dataset yang diperoleh dari Kaggle dan UCI Repository, dengan total 1211 data pasien. Setelah dilakukan preprocessing, data dibagi dengan rasio 70:30 untuk pelatihan dan pengujian. Evaluasi kinerja model dilakukan menggunakan metrik akurasi, presisi, dan recall berbasis confusion matrix. Hasil penelitian menunjukkan bahwa algoritma C4.5 memiliki performa terbaik dengan akurasi 81,07%, mengungguli Naïve Bayes (79,10%) dan KNN (75,68%). C4.5 juga menunjukkan nilai recall yang lebih tinggi dalam mendeteksi kasus positif penyakit jantung, mengindikasikan efektivitasnya dalam menangani data dengan karakteristik klinis seperti dataset yang digunakan. Kontribusi utama penelitian ini adalah memberikan rekomendasi pemanfaatan algoritma C4.5 dalam pengembangan sistem pendukung keputusan untuk deteksi dini penyakit jantung. Temuan ini diharapkan dapat membantu meningkatkan akurasi diagnosis awal dan mendukung pengambilan keputusan medis secara lebih cepat dan tepat
Keywords
Full Text:
PDFReferences
Akbarollah, M. F., Wiyanto, W., Ardiatma, D., & Zy, A. T. (2023). Penerapan algoritma k-nearest neighbor dalam klasifikasi penyakit jantung. Journal of Computer System and Informatics (JoSYC), 4(4), 850–860. https://doi.org/10.47065/josyc.v4i4.4071
Bouqentar, M. A., Terrada, O., Hamida, S., Saleh, S., Lamrani, D., Cherradi, B., & Raihani, A. (2024). Early heart disease prediction using feature engineering and machine learning algorithms. Heliyon, 10, e38731. https://doi.org/10.1016/j.heliyon.2024.e38731
Derisma. (2020). Perbandingan kinerja algoritma untuk prediksi penyakit jantung dengan teknik data mining. Journal of Applied Informatics and Computing (JAIC), 4(1). https://doi.org/10.30871/jaic.v4i1.2152
Dinas Kesehatan Provinsi Aceh. (2023). Kemenkes: Penyakit kardiovaskular penyebab kematian tertinggi di Indonesia. Dinas Kesehatan Provinsi Aceh. https://dinkes.acehprov.go.id/detailpost/kemenkes-penyakit-kardiovaskular-penyebab-kematian-tertinggi-di-indonesia
Indriyani, T., Rozi, F. F., Hakimah, M., Rozi, N. F., & Muhima, R. R. (2024). Metode decision tree c4.5 untuk klasifikasi penyakit jantung. Prosiding Seminar Nasional Sains dan Teknologi Terapan (SNTEK-PAN) XII (ISSN 2685-6875). Institut Teknologi Adhi Tama Surabaya.
InfoWorld. (2020). Kaggle: Where data scientists learn and compete. https://www.infoworld.com/article/2258785/kaggle-where-data-scientists-learn-and-compete.html
Khoirudin. (2024). Klasifikasi penyakit jantung menggunakan perbandingan algoritma Decision Tree dan Naïve Bayes. Kopertip: Jurnal Ilmiah Manajemen Informatika dan Komputer, 8(1), 19–25. https://doi.org/10.32485/kopertip.v8i1.351
Lestari, M. (2014). Penerapan algoritma klasifikasi Nearest Neighbor (K-NN) untuk mendeteksi penyakit jantung. Faktor Exacta, 7(4), 366–371. https://doi.org/10.30998/faktorexacta.v7i4.290
Maulana, D., & Yahya, R. (2019). Implementasi algoritma Naïve Bayes untuk klasifikasi penderita penyakit jantung di Indonesia menggunakan Rapid Miner. Jurnal Teknik Informatika dan Sistem Informasi (JURTIF), 10(2), 67–75.
Muthohhar, J. D., & Prihanto, A. (2023). Analisis perbandingan algoritma klasifikasi untuk penyakit jantung. Journal of Informatics and Computer Science (JINACS), 4(3), 298-304. https://doi.org/10.26740/jinacs.v4n03.p298-304
Narulita, S., & Adi, P. N. (2024). Feature selection information gain pada klasifikasi pasien penyakit jantung (heart disease). Jurnal Rekam Medis & Manajemen Informasi Kesehatan, 4(1), 13–19. https://doi.org/10.53416/jurmik.v4i1.240
Nurkholifah, M., NofiarAm, A., & Oktorina, F. K. (2023). Analisa penyakit jantung menggunakan algoritma Naïve Bayes. Journal of System and Computer Engineering (JSCE), 4(1), 26–36. https://doi.org/10.47650/jsce.v4i1.671
Permana, A. P., Ainiyah, K., & Holle, K. F. H. (2021). Analisis perbandingan algoritma Decision Tree, kNN, dan Naive Bayes untuk prediksi kesuksesan start-up. JISKa: Jurnal Informatika Sunan Kalijaga, 6(3), 178–188. https://doi.org/10.14421/jiska.2021.6.3.178-188
Scholar, A. (2023, June 11). Understanding the importance of the 70/30 rule in machine learning. Insight Tribune. https://www.nalug.net/understanding-the-importance-of-the-70-30-rule-in-machine-learning/
Widaningsih, S. (2019). Perbandingan metode data mining untuk prediksi nilai dan waktu kelulusan mahasiswa prodi Teknik Informatika dengan algoritma C4.5, Naïve Bayes, KNN dan SVM. Jurnal Tekno Insentif, 13(1), 16–25. https://doi.org/10.36787/jti.v13i1.78
DOI: https://doi.org/10.37905/jji.v1i1.31158
Refbacks
- There are currently no refbacks.
JJIhas been indexed by:
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
Editorial Office |
Engineering Faculty Building, 1st Floor Jl. Prof. Dr. Ing. B. J. Habibie, Bone Bolango, Gorontalo, 96119, Indonesia. Whatsapp: +6281314270499 Email: jji.ft@ung.ac.id |
![]() |
|