Penerapan Metode Oversampling SMOTE Pada Algoritma Random Forest Untuk Prediksi Kebangkrutan Perusahaan

Authors

  • Agung Nugroho Universitas Pelita Bangsa
  • Elkin Rilvani Universitas Pelita Bangsa

DOI:

https://doi.org/10.33633/tc.v22i1.7527

Keywords:

Bankruptcy, Oversampling, SMOTE, Random Forest

Abstract

Kemajuan teknologi informasi berkembang kearah finansial dalam melakukan prediski. Banyak model algoritma prediksi data keuangan telah dikembangkan. Prediksi kebangkrutan merupakan sesuatu yang sangat penting bagi organisasi atau perusahaan dalam mengambil keputusan yang diperlukan oleh pemodal dan investor. Prediksi kebangkrutan termasuk dalam permasalahan ketidakseimbangan kelas dalam model kalsifikasi karena jumlah data yang termasuk dalam kelas bangkrut jauh lebih sedikit dibandingkan dengan data yang termasuk dalam kelas tidak bangkrut. Tujuan dari penelitian ini adalah untuk menghasilkan model klasifikasi yang baik untuk prediksi risiko kebangkrutan pada perusahaan. preprocessing data dilakukan untuk melakukan optimasi algoritma klasifikasi dengan metode oversampling SMOTE agar menghasilkan model kalsifikasi yang optimal. Algoritma klasifikasi yang digunakan adalah Random Forest Classification untuk mendapatkan hasil prediksi kebangkrutan yang optimal. Berdasarkan hasil pengujian yang telah dilakukan didapatkan bahwa performa klasifikasi meningkat sebesar 7,40% setelah dilakukan preprocessing data dengan menggunakan teknik oversampling SMOTE pada algoritma Random Forest Classifier.

References

A. S. Ramadhani and N. Lukviarman, “Perbandingan Analisis Prediksi Kebangkrutan Menggunakan Model Altman Pertama, Altman Revisi, dan Altman Modifikasi dengan Ukuran dan Umur Perusahaan sebagai Variabel Penjelas (Studi Pada Perusahaan Manufaktur yang Terdaftar di Bursa Efek Indonesia),” J. Siasat Bisnis, vol. 13, no. 1, Mar. 2011 [Online]. Available: https://journal.uii.ac.id/JSB/article/view/2011

S. D. Saladi and R. Yarlagadda, “An Enhanced Bankruptcy Prediction Model Using Fuzzy Clustering Model and Random Forest Algorithm,” Rev. d’Intelligence Artif., vol. 35, no. 1, pp. 77–83, Feb. 2021, doi: 10.18280/ria.350109.

Haibo He and E. A. Garcia, “Learning from Imbalanced Data,” IEEE Trans. Knowl. Data Eng., vol. 21, no. 9, pp. 1263–1284, Sep. 2009, doi: 10.1109/TKDE.2008.239. [Online]. Available: http://ieeexplore.ieee.org/document/5128907/

S. M. Abd Elrahman and A. Abraham, “A Review of Class Imbalance Problem,” 2013 [Online]. Available: www.mirlabs.net/jnic/index.html

K. Jiang, J. Lu, and K. Xia, “A Novel Algorithm for Imbalance Data Classification Based on Genetic Algorithm Improved SMOTE,” Arab. J. Sci. Eng., vol. 41, no. 8, pp. 3255–3266, Aug. 2016, doi: 10.1007/s13369-016-2179-2. [Online]. Available: http://link.springer.com/10.1007/s13369-016-2179-2

A. N. Rais and A. Subekti, “Integrasi SMOTE dan Ensemble AdaBoost Untuk Mengatasi Imbalance Class Pada Data Bank Direct Marketing,” J. Inform., vol. 6, no. 2, pp. 278–285, 2019, doi: http://dx.doi.org/10.31294/ji.v6i2.6186. [Online]. Available: https://ejournal.bsi.ac.id/ejurnal/index.php/ji/article/view/6186. [Accessed: 11-Nov-2021]

J. Han, M. Kamber, and J. Pei, Data Mining: Concepts and Techniques. Elsevier, 2012.

Y. E. Kurniawati, “Class Imbalanced Learning Menggunakan Algoritma Synthetic Minority Over-sampling Technique – Nominal (SMOTE-N) pada Dataset Tuberculosis Anak,” J. Buana Inform., vol. 10, no. 2, p. 134, Oct. 2019, doi: 10.24002/jbi.v10i2.2441. [Online]. Available: https://ojs.uajy.ac.id/index.php/jbi/article/view/2441

G. A. Pradipta, R. Wardoyo, A. Musdholifah, and I. N. H. Sanjaya, “Radius-SMOTE: A New Oversampling Technique of Minority Samples Based on Radius Distance for Learning From Imbalanced Data,” IEEE Access, vol. 9, pp. 74763–74777, 2021, doi: 10.1109/ACCESS.2021.3080316. [Online]. Available: https://ieeexplore.ieee.org/document/9431216/

Yoga Religia, Agung Nugroho, and Wahyu Hadikristanto, “Klasifikasi Analisis Perbandingan Algoritma Optimasi pada Random Forest untuk Klasifikasi Data Bank Marketing,” J. RESTI (Rekayasa Sist. dan Teknol. Informasi), vol. 5, no. 1, pp. 187–192, Feb. 2021, doi: 10.29207/resti.v5i1.2813. [Online]. Available: http://jurnal.iaii.or.id/index.php/RESTI/article/view/2813

W. Zhang, “Machine Learning Approaches to Predicting Company Bankruptcy,” J. Financ. Risk Manag., vol. 06, no. 04, pp. 364–374, 2017, doi: 10.4236/jfrm.2017.64026.

A. Parmar, R. Katariya, and V. Patel, “A Review on Random Forest: An Ensemble Classifier,” 2019, pp. 758–763 [Online]. Available: http://link.springer.com/10.1007/978-3-030-03146-6_86

J. Chen et al., “A Parallel Random Forest Algorithm for Big Data in a Spark Cloud Computing Environment,” IEEE Trans. Parallel Distrib. Syst., vol. 28, no. 4, pp. 919–933, Apr. 2017, doi: 10.1109/TPDS.2016.2603511. [Online]. Available: http://ieeexplore.ieee.org/document/7557062/

Downloads

Published

2024-06-21