Komparasi Kinerja Algoritma C4.5, Random Forest, dan Gradient Boosting untuk Klasifikasi Komoditas

Authors

  • Edi Ismanto Universitas Muhammadiyah Riau
  • Melly Novalia Universitas Muhammadiyah Riau

DOI:

https://doi.org/10.33633/tc.v20i3.4576

Keywords:

Data Mining, Algoritma C4.5, Random Forest, Gradient Boosting, Classification

Abstract

Penentuan komoditas unggulan pada suatu daerah merupakan hal yang sangat penting untuk dilakukan, salah satunya di Provinsi Riau. Memahami mengenai prioritas perencanaan pengembangan wilayah yang diarahkan pada pengembangan komoditas unggulan. Sejauh ini Provinsi Riau memiliki potensi komoditas disektor perkebunan yang sangat menjajikan, data yang ada sebelumnya banyak digunakan sebagai laporan, dalam bentuk data excel. Data komoditas bisa digali dengan teknik data mining untuk mendapatkan pola klasifikasi, sehingga lebih memudahkan Pemerintah Provinsi Riau dalam mendapatkan informasi komoditas unggulannya. Pada penelitian ini, dilakukan pengujian kinerja algoritma klasifikasi yang banyak digunakan dalam data mining, agar mendapatkan algoritma yang memiliki kinerja paling baik untuk klasifikasi data komoditas. Beberapa penelitian mengatakan algoritma klasifikasi C4.5 memiliki kinerja kurang baik dibandingkan dengan algoritma yang lain seperti random forest, dan gradient boosting. Dalam penelitian ini dilakukan perbandingan antara algoritma C4.5, random forest, dan gradient boosting, untuk mengukur kinerja terbaik dalam melakukan klasifikasi data komoditas. Data yang digunakan dalam penelitian ini yaitu data komoditas perkebunan Provinsi Riau pada tahun 2019. Hasil dari penelitian ini, algoritma yang memiliki kinerja terbaik untuk  klasifikasi adalah algoritma random forest dengan syarat menggunakan shuffle sampling. Dan mayoritas linear sampling menghasilkan kinerja kurang baik. Sedangkan shuffle sampling memiliki kinerja sangat baik untuk algoritma berbasis tree.

References

S. Agarwal, Data mining: Data mining concepts and techniques. 2014.

S. Sularno and P. Anggraini, “Penerapan Algoritma C4.5 Untuk Klasifikasi Tingkat Keganasan Hama Pada Tanaman Padi,” Jurnal Sains dan Informatika, vol. 3, no. 2, p. 161, 2017, doi: 10.22216/jsi.v3i2.2779.

A. Asroni, B. Masajeng Respati, and S. Riyadi, “Penerapan Algoritma C4.5 untuk Klasifikasi Jenis Pekerjaan Alumni di Universitas Muhammadiyah Yogyakarta,” Semesta Teknika, vol. 21, no. 2, pp. 158–165, 2018, doi: 10.18196/st.212222.

E. P. Cynthia and E. Ismanto, “Metode Decision Tree Algoritma C.45 Dalam Mengklasifikasi Data Penjualan,” Jurnal Riset Sistem Informasi Dan Teknik Informatika (JURASI), vol. (3) Juli, no. July, pp. 1–13, 2018, [Online]. Available: http://tunasbangsa.ac.id/ejurnal/index.php/jurasik/article/download/60/pdf.

E. Sugiatna, A. M. Ibrahim, and I. Abdul Hadi, “Implementasi Algoritma Klasifikasi C4.5 Untuk Memprediksi Kelayakan Pembelian Kendaraan,” JTIM : Jurnal Teknologi Informasi dan Multimedia, vol. 1, no. 2, pp. 124–132, 2019, doi: 10.35746/jtim.v1i2.26.

N. Nanni and A. Sudransyah, “Perbandingan Kinerja Algoritma Naive Bayes dan C4.5 Untuk Klasifikasi Harga Pangan,” PROtek : Jurnal Ilmiah Teknik Elektro, vol. 7, no. 1, pp. 20–24, 2020, doi: 10.33387/protk.v7i1.1710.

A. Yuliana and D. B. Pratomo, “Memprediksi Kepuasan Mahasiswa Terhadap Kinerja Dosen Politeknik TEDC Bandung,” Semnasinotek 2017, pp. 377–384, 2017.

G. Lukhayu Pritalia, “Penerapan Algoritma C4.5 untuk Penentuan Ketersediaan Barang E-commerce,” Indonesian Journal of Information Systems, vol. 1, no. 1, pp. 47–56, 2018, doi: 10.24002/ijis.v1i1.1727.

U. Khultsum and A. Subekti, “Penerapan Algoritma Random Forest dengan Kombinasi Ekstraksi Fitur Untuk Klasifikasi Penyakit Daun Tomat,” Jurnal Media Informatika, vol. 5, pp. 186–193, 2021, doi: 10.30865/mib.v5i1.2624.

S. Devella, Y. Yohannes, and F. N. Rahmawati, “Implementasi Random Forest Untuk Klasifikasi Motif Songket Palembang Berdasarkan SIFT,” JATISI (Jurnal Teknik Informatika dan Sistem Informasi), vol. 7, no. 2, pp. 310–320, 2020, doi: 10.35957/jatisi.v7i2.289.

D. S. S. Wuisan, “Penerapan Algoritma Klasifikasi Random Forest Untuk Penentuan Kelayakan Pemberian Kredit di Koperasi Mitra Sejahtera,” Journal Of Technology Information, vol. 6, no. 1, pp. 29–34, 2020, [Online]. Available: https://ojs.uajy.ac.id/index.php/IJIS/article/view/1704/1195.

T. Online, S. Kasus, D. Acak, P. Awal, and M. Pandemic, “Prediksi Harga Bitcoin Menggunakan Metode Random Forest,” Jurnal Komputer Terapan, vol. 7, no. 1, pp. 24–32, 2021.

V. W. Siburian and I. E. Mulyana, “Prediksi Harga Ponsel Menggunakan Metode Random Forest,” Prosiding Annual Research Seminar, vol. 4, no. 1, pp. 144–147, 2018.

A. Primajaya and B. N. Sari, “Random Forest Algorithm for Prediction of Precipitation,” Indonesian Journal of Artificial Intelligence and Data Mining, vol. 1, no. 1, p. 27, 2018, doi: 10.24014/ijaidm.v1i1.4903.

I. Muslim, K. Karo, F. Informatika, and U. Telkom, “Implementasi Metode XGBoost dan Feature Importance untuk Klasifikasi pada Kebakaran Hutan dan Lahan,” Journal of Software Engineering, Information and …, vol. 1, no. 1, pp. 10–16, 2020, [Online]. Available: https://ejournal.upi.edu/index.php/SEICT/article/view/29347.

A. Bisri and R. Rachmatika, “Integrasi Gradient Boosted Trees dengan SMOTE dan Bagging untuk Deteksi Kelulusan Mahasiswa,” Jurnal Nasional Teknik Elektro dan Teknologi Informasi (JNTETI), vol. 8, no. 4, p. 309, 2019, doi: 10.22146/jnteti.v8i4.529.

R. Sun, G. Wang, W. Zhang, L. T. Hsu, and W. Y. Ochieng, “A gradient boosting decision tree based GPS signal reception classification algorithm,” Applied Soft Computing Journal, vol. 86, no. xxxx, p. 105942, 2020, doi: 10.1016/j.asoc.2019.105942.

N. Nyoman, P. Pinata, I. M. Sukarsa, N. Kadek, and D. Rus jayanthi, “Prediksi Kecelakaan Lalu Lintas di Bali dengan XGBoost pada Python,” Jurnal Ilmiah Merpati, vol. 8, no. 3, pp. 188–196, 2020.

S. R. Putri, T. Informatika, U. Pamulang, T. Selatan-indonesia, and G. B. Trees, “Teknik Bagging untuk Mengurangi Kesalahan Klasifikasi Algoritma Gradient Boosted Tress (GBT) Pada Prediksi Kanker Payudara,” Prosiding Seminar Nasional Informatika dan Sistem Informasi, vol. 3, pp. 566–572, 2020.

S. Agarwal, Data mining: Data mining concepts and techniques. 2014.

M. Bramer, Introduction to Data Mining. 2016.

V. Kotu and B. Deshpande, Predictive Analytics and Data Mining: Concepts and Practice with RapidMiner. 2014.

Downloads

Published

2021-08-28