Efektivitas Algoritma Random Forest, XGBoost, dan Logistic Regression dalam Prediksi Penyakit Paru-paru

Authors

  • Bernardus Septian Cahya Putra Universitas Amikom Purwokerto
  • Imam Tahyudin Universitas Amikom Purwokerto
  • Bagus Adhi Kusuma Universitas Amikom Purwokerto
  • Khairunnisak Nur Isnaini Universitas Amikom Purwokerto

DOI:

https://doi.org/10.62411/tc.v23i4.11705

Abstract

Penyakit paru-paru, seperti pneumonia dan kanker paru-paru, menjadi masalah kesehatan global dengan tingkat kematian tinggi, terutama dipengaruhi oleh polusi udara, infeksi, dan kebiasaan merokok. Pencegahan dan deteksi dini sangat penting dalam mengurangi dampaknya. Algoritma yang digunakan dalam penelitian ini meliputi Random Forest, XGBoost, dan Logistic Regression. Tujuannya yaitu untuk membandingkan performa tiga algoritma machine learning dalam mengklasifikasikan penyakit paru-paru menggunakan metrik evaluasi seperti, akurasi, presisi, recall, dan F1-score.  Setelah hyperparameter tuning, XGBoost menunjukkan hasil terbaik dengan akurasi 94,44%, presisi 94,98%, recall 94,44%, dan F1-score 94,41%, menunjukkan keseimbangan optimal antara presisi dan recall. Random Forest juga memberikan hasil yang sebanding dengan XGBoost dengan akurasi dan presisi yang tinggi. Sementara itu, Logistic Regression menunjukkan keterbatasan dalam menangani data yang kompleks, dengan performa yang lebih rendah pada seluruh metrik evaluasi. Penelitian ini menunjukkan bahwa algoritma berbasis pohon keputusan seperti XGBoost dan Random Forest lebih unggul untuk klasifikasi penyakit paru-paru, menjadikannya metode yang lebih andal untuk mendukung deteksi dini penyakit ini.   Kata kunci: Hyperparameter Tuning, Logistic Regression, Penyakit Paru-paru, Random Forest, XGBoost.

Downloads

Published

2024-11-27