Pengaruh Teknik Preprocessing terhadap Kinerja Model Explainable Boosting Machine (EBM) untuk Prediksi Serangan Jantung
Saved in:
| Title: | Pengaruh Teknik Preprocessing terhadap Kinerja Model Explainable Boosting Machine (EBM) untuk Prediksi Serangan Jantung |
|---|---|
| Authors: | Setiawan, Moch. Andri, Efendi, Moh. Hasan, Akbar, Muhammad Farizal, Pratama, Wildan Septian |
| Source: | Nusantara of Engineering (NOE); Vol. 8 No. 02 (2025): Volume 8 Nomor 2-2025; 317-326 Nusantara of Engineering (NOE); Vol 8 No 02 (2025): Volume 8 Nomor 2-2025; 317-326 |
| Publisher Information: | Universitas Nusantara PGRI Kediri, 2025. |
| Publication Year: | 2025 |
| Subject Terms: | Explainable Boosting Machine, ketidakseimbangan data, missing value, preprocessing, SMOTE-ENN |
| Description: | Serangan jantung merupakan penyakit kardiovaskular yang sering terjadi secara tiba-tiba dan menjadi salah satu penyebab kematian tertinggi. Deteksi dini terhadap risiko serangan jantung masih menjadi tantangan karena keterbatasan sistem prediksi yang akurat dan mudah dipahami. Oleh karena itu, penelitian ini penting dilakukan untuk menghasilkan model prediksi yang tidak hanya akurat, tetapi juga interpretatif. Penelitian ini bertujuan mengembangkan model prediksi risiko serangan jantung berbasis machine learning menggunakan algoritma Explainable Boosting Machine (EBM). Proses dilakukan dengan pendekatan CRISP-DM serta optimasi pada tahap preprocessing, khususnya penanganan missing value melalui pemetaan data dan penanganan ketidakseimbangan data menggunakan metode SMOTE-ENN. Dataset yang digunakan berasal dari Kaggle, terdiri atas 158.355 baris dan 28 atribut yang mencerminkan faktor demografi, gaya hidup, lingkungan, serta kondisi klinis. Penelitian mencakup lima eksperimen berdasarkan variasi parameter SMOTE dan ENN. Hasil menunjukkan bahwa eksperimen SMOTEENN Sharp (SENS) menghasilkan akurasi tertinggi sebesar 74%, namun mengalami ketidakseimbangan klasifikasi pada kelas berisiko. Sementara itu, eksperimen SMOTEENN Aggressive (SENA) meningkatkan recall pada kelas berisiko, namun menurunkan akurasi menjadi 67%.Temuan ini menunjukkan bahwa strategi penanganan data yang optimal pada tahap preprocessing sangat berpengaruh terhadap kemampuan model dalam mengenali risiko serangan jantung secara lebih akurat dan seimbang. |
| Document Type: | Article |
| File Description: | application/pdf |
| Language: | English |
| ISSN: | 2355-6684 2776-6640 |
| DOI: | 10.29407/noe.v8i02.25811 |
| Access URL: | https://ojs.unpkediri.ac.id/index.php/noe/article/view/25811 |
| Rights: | CC BY SA |
| Accession Number: | edsair.9e0ed7a5532b..a29fcb1f4584b64f8ff541714bb6956f |
| Database: | OpenAIRE |
| Abstract: | Serangan jantung merupakan penyakit kardiovaskular yang sering terjadi secara tiba-tiba dan menjadi salah satu penyebab kematian tertinggi. Deteksi dini terhadap risiko serangan jantung masih menjadi tantangan karena keterbatasan sistem prediksi yang akurat dan mudah dipahami. Oleh karena itu, penelitian ini penting dilakukan untuk menghasilkan model prediksi yang tidak hanya akurat, tetapi juga interpretatif. Penelitian ini bertujuan mengembangkan model prediksi risiko serangan jantung berbasis machine learning menggunakan algoritma Explainable Boosting Machine (EBM). Proses dilakukan dengan pendekatan CRISP-DM serta optimasi pada tahap preprocessing, khususnya penanganan missing value melalui pemetaan data dan penanganan ketidakseimbangan data menggunakan metode SMOTE-ENN. Dataset yang digunakan berasal dari Kaggle, terdiri atas 158.355 baris dan 28 atribut yang mencerminkan faktor demografi, gaya hidup, lingkungan, serta kondisi klinis. Penelitian mencakup lima eksperimen berdasarkan variasi parameter SMOTE dan ENN. Hasil menunjukkan bahwa eksperimen SMOTEENN Sharp (SENS) menghasilkan akurasi tertinggi sebesar 74%, namun mengalami ketidakseimbangan klasifikasi pada kelas berisiko. Sementara itu, eksperimen SMOTEENN Aggressive (SENA) meningkatkan recall pada kelas berisiko, namun menurunkan akurasi menjadi 67%.Temuan ini menunjukkan bahwa strategi penanganan data yang optimal pada tahap preprocessing sangat berpengaruh terhadap kemampuan model dalam mengenali risiko serangan jantung secara lebih akurat dan seimbang. |
|---|---|
| ISSN: | 23556684 27766640 |
| DOI: | 10.29407/noe.v8i02.25811 |
Nájsť tento článok vo Web of Science