Analisis Performa Deep Embedded Clustering untuk Pendeteksian Topik
DOI:
https://doi.org/10.62411/tc.v24i1.11841Abstract
Pendeteksian topik adalah solusi untuk mengungkap struktur laten dalam sebuah dokumen. Kerangka umum pendeteksian topik berbasis clustering terdiri dari dua langkah: pembelajaran representasi dan pendeteksian topik melalui clustering. Dalam penelitian ini, Bidirectional Encoder Representations from Transformers (BERT) digunakan untuk pembelajaran representasi karena BERT mampu menangkap konteks setiap kata berdasarkan kata-kata di sekitarnya. Representasi teks yang diperoleh dari BERT digunakan untuk pendeteksian topik dengan clustering. Deep Embedded Clustering (DEC) dan Improved DEC (IDEC) adalah model clustering berbasis deep learning yang digunakan dalam penelitian ini untuk pendeteksian topik. DEC dan IDEC mampu mengubah data ke dalam ruang dimensi yang lebih rendah serta mengoptimalkan cluster secara simultan. Output dari teknik clustering berupa kata-kata kunci yang menggambarkan setiap topik cluster. Setelah mendapat kata kunci yang mewakili topik, evaluasi model dilakukan dengan melakukan perbandingan nilai topic coherence menggunakan Topic Coherence - Word2Vec (TC-W2V) sebagai analisis kuantitatif. Penelitian ini merupakan perluasan dari penerapan DEC dan IDEC pada pendeteksian topik dengan menambahkan analisis visualisasi dan kata kunci. Simulasi menunjukkan bahwa DEC dan IDEC mengungguli Uniform Manifold Approximation and Projection (UMAP)-based k-means (UKM) dan Eigenspace-Based Fuzzy C-Means (EFCM) dari segi nilai TC-W2V, hasil visualisasi, dan kata kunci. Kata kunci: analisis teks, deep clustering, pemrosesan teksDownloads
Published
Issue
Section
License
Copyright (c) 2025 Danu Julian Cahyadi, Hendri Murfi, Yudi Satria, Sarini Abdullah, Yekti Widyaningsih

This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.
License Terms
All articles published in Techno.COM Journal are licensed under the Creative Commons Attribution-NonCommercial 4.0 International (CC BY-NC 4.0). This means:
1. Attribution
Readers and users are free to:
-
Share – Copy and redistribute the material in any medium or format.
-
Adapt – Remix, transform, and build upon the material.
As long as proper credit is given to the original work by citing the author(s) and the journal.
2. Non-Commercial Use
-
The material cannot be used for commercial purposes.
-
Commercial use includes selling the content, using it in commercial advertising, or integrating it into products/services for profit.
3. Rights of Authors
-
Authors retain copyright and grant Techno.COM Journal the right to publish the article.
-
Authors can distribute their work (e.g., in institutional repositories or personal websites) with proper acknowledgment of the journal.
4. No Additional Restrictions
-
The journal cannot apply legal terms or technological measures that restrict others from using the material in ways allowed by the license.
5. Disclaimer
-
The journal is not responsible for how the published content is used by third parties.
-
The opinions expressed in the articles are solely those of the authors.
For more details, visit the Creative Commons License Page:
? https://creativecommons.org/licenses/by-nc/4.0/