Penanganan Ketidakseimbangan Data Ekstrim pada Sistem Prediksi
DOI:
https://doi.org/10.62411/tc.v24i4.15005Abstract
Salah satu masalah utama dalam sistem prediksi adalah ketidakseimbangan data, di mana kelas tertentu sangat kurang terwakili dibandingkan dengan kelas lainnya. Ketidakseimbangan data dapat menyebabkan bias model, di mana model lebih mudah mendeteksi kelas mayoritas tetapi lemah dalam mendeteksi kelas minoritas. Terutama pada data dengan ketidakseimbangan ekstrem dengan IR >9, model memiliki akurasi tinggi tetapi performa recall rendah. Hal ini merugikan sistem prediksi yang memprioritaskan deteksi kelas minoritas. Penelitian ini bertujuan untuk meningkatkan recall pada dataset yang sangat tidak seimbang dengan menggunakan empat teknik penanganan ketidakseimbangan data, yaitu SMOTE dan OHIT pada level data, serta CSL dan CW pada level model. Teknik pada level data menyeimbangkan distribusi kelas dengan menambahkan data sintetis, sedangkan teknik pada level model meningkatkan sensitivitas terhadap kelas minoritas. Model yang digunakan sebagai baseline adalah LR untuk mengamati peningkatan recall dari keempat teknik penanganan ketidakseimbangan data. Dari hasil pengujian semua teknik penanganan ketidakseimbangan data, semuanya meningkatkan recall dengan margin sebesar 0,3243. Peningkatan recall tertinggi dicapai oleh LR-SMOTE dengan margin sebesar 0,3256. Penelitian ini menunjukkan bahwa recall model dapat ditingkatkan dengan menggunakan teknik penanganan ketidakseimbangan data. Kata kunci – ketidakseimbangan data ekstrem, sistem prediksi, recall, penanganan ketidakseimbangan dataDownloads
Published
Issue
Section
License
Copyright (c) 2025 Ari Nugroho Putro, Much Aziz Muslim

This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.
License Terms
All articles published in Techno.COM Journal are licensed under the Creative Commons Attribution-NonCommercial 4.0 International (CC BY-NC 4.0). This means:
1. Attribution
Readers and users are free to:
-
Share – Copy and redistribute the material in any medium or format.
-
Adapt – Remix, transform, and build upon the material.
As long as proper credit is given to the original work by citing the author(s) and the journal.
2. Non-Commercial Use
-
The material cannot be used for commercial purposes.
-
Commercial use includes selling the content, using it in commercial advertising, or integrating it into products/services for profit.
3. Rights of Authors
-
Authors retain copyright and grant Techno.COM Journal the right to publish the article.
-
Authors can distribute their work (e.g., in institutional repositories or personal websites) with proper acknowledgment of the journal.
4. No Additional Restrictions
-
The journal cannot apply legal terms or technological measures that restrict others from using the material in ways allowed by the license.
5. Disclaimer
-
The journal is not responsible for how the published content is used by third parties.
-
The opinions expressed in the articles are solely those of the authors.
For more details, visit the Creative Commons License Page:
? https://creativecommons.org/licenses/by-nc/4.0/










