Komparasi Kinerja Algoritma C4.5, Random Forest, dan Gradient Boosting untuk Klasifikasi Komoditas
DOI:
https://doi.org/10.33633/tc.v20i3.4576Keywords:
Data Mining, Algoritma C4.5, Random Forest, Gradient Boosting, ClassificationAbstract
Penentuan komoditas unggulan pada suatu daerah merupakan hal yang sangat penting untuk dilakukan, salah satunya di Provinsi Riau. Memahami mengenai prioritas perencanaan pengembangan wilayah yang diarahkan pada pengembangan komoditas unggulan. Sejauh ini Provinsi Riau memiliki potensi komoditas disektor perkebunan yang sangat menjajikan, data yang ada sebelumnya banyak digunakan sebagai laporan, dalam bentuk data excel. Data komoditas bisa digali dengan teknik data mining untuk mendapatkan pola klasifikasi, sehingga lebih memudahkan Pemerintah Provinsi Riau dalam mendapatkan informasi komoditas unggulannya. Pada penelitian ini, dilakukan pengujian kinerja algoritma klasifikasi yang banyak digunakan dalam data mining, agar mendapatkan algoritma yang memiliki kinerja paling baik untuk klasifikasi data komoditas. Beberapa penelitian mengatakan algoritma klasifikasi C4.5 memiliki kinerja kurang baik dibandingkan dengan algoritma yang lain seperti random forest, dan gradient boosting. Dalam penelitian ini dilakukan perbandingan antara algoritma C4.5, random forest, dan gradient boosting, untuk mengukur kinerja terbaik dalam melakukan klasifikasi data komoditas. Data yang digunakan dalam penelitian ini yaitu data komoditas perkebunan Provinsi Riau pada tahun 2019. Hasil dari penelitian ini, algoritma yang memiliki kinerja terbaik untuk klasifikasi adalah algoritma random forest dengan syarat menggunakan shuffle sampling. Dan mayoritas linear sampling menghasilkan kinerja kurang baik. Sedangkan shuffle sampling memiliki kinerja sangat baik untuk algoritma berbasis tree.References
S. Agarwal, Data mining: Data mining concepts and techniques. 2014.
S. Sularno and P. Anggraini, “Penerapan Algoritma C4.5 Untuk Klasifikasi Tingkat Keganasan Hama Pada Tanaman Padi,” Jurnal Sains dan Informatika, vol. 3, no. 2, p. 161, 2017, doi: 10.22216/jsi.v3i2.2779.
A. Asroni, B. Masajeng Respati, and S. Riyadi, “Penerapan Algoritma C4.5 untuk Klasifikasi Jenis Pekerjaan Alumni di Universitas Muhammadiyah Yogyakarta,” Semesta Teknika, vol. 21, no. 2, pp. 158–165, 2018, doi: 10.18196/st.212222.
E. P. Cynthia and E. Ismanto, “Metode Decision Tree Algoritma C.45 Dalam Mengklasifikasi Data Penjualan,” Jurnal Riset Sistem Informasi Dan Teknik Informatika (JURASI), vol. (3) Juli, no. July, pp. 1–13, 2018, [Online]. Available: http://tunasbangsa.ac.id/ejurnal/index.php/jurasik/article/download/60/pdf.
E. Sugiatna, A. M. Ibrahim, and I. Abdul Hadi, “Implementasi Algoritma Klasifikasi C4.5 Untuk Memprediksi Kelayakan Pembelian Kendaraan,” JTIM : Jurnal Teknologi Informasi dan Multimedia, vol. 1, no. 2, pp. 124–132, 2019, doi: 10.35746/jtim.v1i2.26.
N. Nanni and A. Sudransyah, “Perbandingan Kinerja Algoritma Naive Bayes dan C4.5 Untuk Klasifikasi Harga Pangan,” PROtek : Jurnal Ilmiah Teknik Elektro, vol. 7, no. 1, pp. 20–24, 2020, doi: 10.33387/protk.v7i1.1710.
A. Yuliana and D. B. Pratomo, “Memprediksi Kepuasan Mahasiswa Terhadap Kinerja Dosen Politeknik TEDC Bandung,” Semnasinotek 2017, pp. 377–384, 2017.
G. Lukhayu Pritalia, “Penerapan Algoritma C4.5 untuk Penentuan Ketersediaan Barang E-commerce,” Indonesian Journal of Information Systems, vol. 1, no. 1, pp. 47–56, 2018, doi: 10.24002/ijis.v1i1.1727.
U. Khultsum and A. Subekti, “Penerapan Algoritma Random Forest dengan Kombinasi Ekstraksi Fitur Untuk Klasifikasi Penyakit Daun Tomat,” Jurnal Media Informatika, vol. 5, pp. 186–193, 2021, doi: 10.30865/mib.v5i1.2624.
S. Devella, Y. Yohannes, and F. N. Rahmawati, “Implementasi Random Forest Untuk Klasifikasi Motif Songket Palembang Berdasarkan SIFT,” JATISI (Jurnal Teknik Informatika dan Sistem Informasi), vol. 7, no. 2, pp. 310–320, 2020, doi: 10.35957/jatisi.v7i2.289.
D. S. S. Wuisan, “Penerapan Algoritma Klasifikasi Random Forest Untuk Penentuan Kelayakan Pemberian Kredit di Koperasi Mitra Sejahtera,” Journal Of Technology Information, vol. 6, no. 1, pp. 29–34, 2020, [Online]. Available: https://ojs.uajy.ac.id/index.php/IJIS/article/view/1704/1195.
T. Online, S. Kasus, D. Acak, P. Awal, and M. Pandemic, “Prediksi Harga Bitcoin Menggunakan Metode Random Forest,” Jurnal Komputer Terapan, vol. 7, no. 1, pp. 24–32, 2021.
V. W. Siburian and I. E. Mulyana, “Prediksi Harga Ponsel Menggunakan Metode Random Forest,” Prosiding Annual Research Seminar, vol. 4, no. 1, pp. 144–147, 2018.
A. Primajaya and B. N. Sari, “Random Forest Algorithm for Prediction of Precipitation,” Indonesian Journal of Artificial Intelligence and Data Mining, vol. 1, no. 1, p. 27, 2018, doi: 10.24014/ijaidm.v1i1.4903.
I. Muslim, K. Karo, F. Informatika, and U. Telkom, “Implementasi Metode XGBoost dan Feature Importance untuk Klasifikasi pada Kebakaran Hutan dan Lahan,” Journal of Software Engineering, Information and …, vol. 1, no. 1, pp. 10–16, 2020, [Online]. Available: https://ejournal.upi.edu/index.php/SEICT/article/view/29347.
A. Bisri and R. Rachmatika, “Integrasi Gradient Boosted Trees dengan SMOTE dan Bagging untuk Deteksi Kelulusan Mahasiswa,” Jurnal Nasional Teknik Elektro dan Teknologi Informasi (JNTETI), vol. 8, no. 4, p. 309, 2019, doi: 10.22146/jnteti.v8i4.529.
R. Sun, G. Wang, W. Zhang, L. T. Hsu, and W. Y. Ochieng, “A gradient boosting decision tree based GPS signal reception classification algorithm,” Applied Soft Computing Journal, vol. 86, no. xxxx, p. 105942, 2020, doi: 10.1016/j.asoc.2019.105942.
N. Nyoman, P. Pinata, I. M. Sukarsa, N. Kadek, and D. Rus jayanthi, “Prediksi Kecelakaan Lalu Lintas di Bali dengan XGBoost pada Python,” Jurnal Ilmiah Merpati, vol. 8, no. 3, pp. 188–196, 2020.
S. R. Putri, T. Informatika, U. Pamulang, T. Selatan-indonesia, and G. B. Trees, “Teknik Bagging untuk Mengurangi Kesalahan Klasifikasi Algoritma Gradient Boosted Tress (GBT) Pada Prediksi Kanker Payudara,” Prosiding Seminar Nasional Informatika dan Sistem Informasi, vol. 3, pp. 566–572, 2020.
S. Agarwal, Data mining: Data mining concepts and techniques. 2014.
M. Bramer, Introduction to Data Mining. 2016.
V. Kotu and B. Deshpande, Predictive Analytics and Data Mining: Concepts and Practice with RapidMiner. 2014.
Downloads
Published
Issue
Section
License
Copyright (c) 2021 Edi Ismanto

This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.
License Terms
All articles published in Techno.COM Journal are licensed under the Creative Commons Attribution-NonCommercial 4.0 International (CC BY-NC 4.0). This means:
1. Attribution
Readers and users are free to:
-
Share – Copy and redistribute the material in any medium or format.
-
Adapt – Remix, transform, and build upon the material.
As long as proper credit is given to the original work by citing the author(s) and the journal.
2. Non-Commercial Use
-
The material cannot be used for commercial purposes.
-
Commercial use includes selling the content, using it in commercial advertising, or integrating it into products/services for profit.
3. Rights of Authors
-
Authors retain copyright and grant Techno.COM Journal the right to publish the article.
-
Authors can distribute their work (e.g., in institutional repositories or personal websites) with proper acknowledgment of the journal.
4. No Additional Restrictions
-
The journal cannot apply legal terms or technological measures that restrict others from using the material in ways allowed by the license.
5. Disclaimer
-
The journal is not responsible for how the published content is used by third parties.
-
The opinions expressed in the articles are solely those of the authors.
For more details, visit the Creative Commons License Page:
? https://creativecommons.org/licenses/by-nc/4.0/