Optimasi Prediksi Prediabetes dengan Metode Fitur Selection dan Imbalance Learning

Authors

  • Samsul Arifin Universitas Amikom Purwokerto
  • Imam Tahyudin Universitas Amikom Purwokerto

DOI:

https://doi.org/10.62411/tc.v24i1.11730

Abstract

Diabetes adalah salah satu tantangan kesehatan global yang terus meningkat, dengan deteksi dini pradiabetes menjadi kunci untuk pencegahan. Data yang digunakan diambil dari Diabetes Health Indicators Dataset dan dipersiapkan melalui tahap feature engineering, analisis korelasi, dan penanganan missing value. Selanjutnya, model dibangun menggunakan tiga algoritma utama, yaitu Random Forest, XGBoost, dan Logistic Regression. Penelitian ini menggabungkan analisis korelasi variabel dan metode imbalance learning untuk mengoptimalkan prediksi pradiabetes menggunakan algoritma machine learning. Untuk menangani ketidakseimbangan data, teknik SMOTE diterapkan guna menghasilkan data sintetik pada kelas minoritas. Hasil penelitian menunjukkan model Random Forest memberikan kinerja terbaik dengan akurasi 97,57%, mengungguli XGBoost dan Logistic Regression. Penerapan analisis korelasi variabel dan imbalance learning terbukti efektif dalam meningkatkan kinerja prediksi dengan identifikasi fitur penting. Penelitian ini menunjukkan bahwa pendekatan yang diterapkan dapat membantu deteksi dini pradiabetes secara lebih akurat dan tepat.   Kata kunci: Diabetes, Deteksi Prediabetes, Machine Learning, Random Forest

Downloads

Published

2025-02-26

Most read articles by the same author(s)

Obs.: This plugin requires at least one statistics/report plugin to be enabled. If your statistics plugins provide more than one metric then please also select a main metric on the admin's site settings page and/or on the journal manager's settings pages.