Pengaruh Teknik Preprocessing terhadap Kinerja Model Explainable Boosting Machine (EBM) untuk Prediksi Serangan Jantung

Uloženo v:
Podrobná bibliografie
Název: Pengaruh Teknik Preprocessing terhadap Kinerja Model Explainable Boosting Machine (EBM) untuk Prediksi Serangan Jantung
Autoři: Setiawan, Moch. Andri, Efendi, Moh. Hasan, Akbar, Muhammad Farizal, Pratama, Wildan Septian
Zdroj: Nusantara of Engineering (NOE); Vol. 8 No. 02 (2025): Volume 8 Nomor 2-2025; 317-326
Nusantara of Engineering (NOE); Vol 8 No 02 (2025): Volume 8 Nomor 2-2025; 317-326
Informace o vydavateli: Universitas Nusantara PGRI Kediri, 2025.
Rok vydání: 2025
Témata: Explainable Boosting Machine, ketidakseimbangan data, missing value, preprocessing, SMOTE-ENN
Popis: Serangan jantung merupakan penyakit kardiovaskular yang sering terjadi secara tiba-tiba dan menjadi salah satu penyebab kematian tertinggi. Deteksi dini terhadap risiko serangan jantung masih menjadi tantangan karena keterbatasan sistem prediksi yang akurat dan mudah dipahami. Oleh karena itu, penelitian ini penting dilakukan untuk menghasilkan model prediksi yang tidak hanya akurat, tetapi juga interpretatif. Penelitian ini bertujuan mengembangkan model prediksi risiko serangan jantung berbasis machine learning menggunakan algoritma Explainable Boosting Machine (EBM). Proses dilakukan dengan pendekatan CRISP-DM serta optimasi pada tahap preprocessing, khususnya penanganan missing value melalui pemetaan data dan penanganan ketidakseimbangan data menggunakan metode SMOTE-ENN. Dataset yang digunakan berasal dari Kaggle, terdiri atas 158.355 baris dan 28 atribut yang mencerminkan faktor demografi, gaya hidup, lingkungan, serta kondisi klinis. Penelitian mencakup lima eksperimen berdasarkan variasi parameter SMOTE dan ENN. Hasil menunjukkan bahwa eksperimen SMOTEENN Sharp (SENS) menghasilkan akurasi tertinggi sebesar 74%, namun mengalami ketidakseimbangan klasifikasi pada kelas berisiko. Sementara itu, eksperimen SMOTEENN Aggressive (SENA) meningkatkan recall pada kelas berisiko, namun menurunkan akurasi menjadi 67%.Temuan ini menunjukkan bahwa strategi penanganan data yang optimal pada tahap preprocessing sangat berpengaruh terhadap kemampuan model dalam mengenali risiko serangan jantung secara lebih akurat dan seimbang.
Druh dokumentu: Article
Popis souboru: application/pdf
Jazyk: English
ISSN: 2355-6684
2776-6640
DOI: 10.29407/noe.v8i02.25811
Přístupová URL adresa: https://ojs.unpkediri.ac.id/index.php/noe/article/view/25811
Rights: CC BY SA
Přístupové číslo: edsair.9e0ed7a5532b..a29fcb1f4584b64f8ff541714bb6956f
Databáze: OpenAIRE
Popis
Abstrakt:Serangan jantung merupakan penyakit kardiovaskular yang sering terjadi secara tiba-tiba dan menjadi salah satu penyebab kematian tertinggi. Deteksi dini terhadap risiko serangan jantung masih menjadi tantangan karena keterbatasan sistem prediksi yang akurat dan mudah dipahami. Oleh karena itu, penelitian ini penting dilakukan untuk menghasilkan model prediksi yang tidak hanya akurat, tetapi juga interpretatif. Penelitian ini bertujuan mengembangkan model prediksi risiko serangan jantung berbasis machine learning menggunakan algoritma Explainable Boosting Machine (EBM). Proses dilakukan dengan pendekatan CRISP-DM serta optimasi pada tahap preprocessing, khususnya penanganan missing value melalui pemetaan data dan penanganan ketidakseimbangan data menggunakan metode SMOTE-ENN. Dataset yang digunakan berasal dari Kaggle, terdiri atas 158.355 baris dan 28 atribut yang mencerminkan faktor demografi, gaya hidup, lingkungan, serta kondisi klinis. Penelitian mencakup lima eksperimen berdasarkan variasi parameter SMOTE dan ENN. Hasil menunjukkan bahwa eksperimen SMOTEENN Sharp (SENS) menghasilkan akurasi tertinggi sebesar 74%, namun mengalami ketidakseimbangan klasifikasi pada kelas berisiko. Sementara itu, eksperimen SMOTEENN Aggressive (SENA) meningkatkan recall pada kelas berisiko, namun menurunkan akurasi menjadi 67%.Temuan ini menunjukkan bahwa strategi penanganan data yang optimal pada tahap preprocessing sangat berpengaruh terhadap kemampuan model dalam mengenali risiko serangan jantung secara lebih akurat dan seimbang.
ISSN:23556684
27766640
DOI:10.29407/noe.v8i02.25811