Analisis Kinerja XGBoost pada Data Seimbang dan tidak Seimbang dalam Klasifikasi Tingkat Keparahan Pasien Hemodialisis
DOI:
https://doi.org/10.54371/jiip.v8i12.9998Abstract
Penelitian ini mengevaluasi pengaruh ketidakseimbangan kelas pada klasifikasi tingkat keparahan hemodialisis (mild, moderate, severe) menggunakan Extreme Gradient Boosting (XGBoost) serta efektivitas Synthetic Minority Oversampling Technique (SMOTE) dalam meningkatkan kinerja model. Dataset mencakup 5.000 rekam pasien dengan 23 fitur klinis–laboratorium; pra-pemrosesan meliputi imputasi median/modus, one-hot encoding, dan standardisasi. Sesuai rancangan penelitian, SMOTE diterapkan sebelum pembagian data, kemudian dilakukan stratified split 60:40 dan 70:30 (latih:uji). Evaluasi menggunakan akurasi, presisi, recall, dan F1-score (macro dan weighted), disertai analisis confusion matrix. Hasil menunjukkan perbaikan konsisten setelah SMOTE, dengan akurasi meningkat dari 0,7055 - 0,8566 (60:40) dan 0,7000 - 0,8705 (70:30), diikuti peningkatan pengenalan kelas minoritas. Temuan ini menegaskan bahwa penyeimbangan data penting untuk klasifikasi yang lebih adil dan andal dalam mendukung keputusan klinis, dengan catatan keterbatasan bahwa penerapan SMOTE sebelum split berpotensi memberikan estimasi kinerja yang lebih optimistis.







