Perbaikan Kinerja Clustering K-Means pada Data Ekonomi Nelayan dengan Perhitungan Sum of Square Error (SSE) dan Optimasi nilai K cluster
DOI:
https://doi.org/10.33633/tc.v20i2.4572Keywords:
Clustering, K-Means, Sum of Square Error WEKAAbstract
Clustering adalah jenismetode statistik yang dipakai untuk mengelompokan banyak data atau objek ke dalam beberapa kelompok (cluster), sehingga objek-objek yang berada dalam satu kelompok akan mempunyai kemiripan yang tinggi. Clustering K-Means merupakan metode pembentukan cluster berbasis data, dimana objek secara acak dalam cluster pertama yang terbentuk dijadikan sebagai titik tengah/titik pusat (centroid). K-means merupakan jenis cluster yang memiliki tingkat ketelitian dan efisiensi yang baik. Kelemahan dalam algoritma k-Means yaitu dalam menganalisa dan menentukan Nilai K dalam mengklaster data pada suatu dataset yang tidak optimal akan menghasilkan cluster yang buruk. Sum of Square Error (SSE) merupakan hasil penjumlahan dari seluruh jarak masing-masing data dengan titik pusat clusternya. Semakin kecil nilai SSE yang didapat, semakin seragam data yang ada didalam masing-masing cluster, semakin baik cluster yang dihasilkan. Penelitian ini melakukan analisis cluster dengan K-means untuk menghasilkan kelompok cluster serta perhitungan nilai Sum of Square Error untuk setiap data dengan nilai K yang berbeda. Proses perhitungan nilai K dalam mencari nilai SSE yang minimum sehingga dapat dilakukan perhitungan selisih nilai SSE dari setiap nilai K cluster. Hasil perhitungan selisih tersebut sebagai penentu jumlah K cluster yang optimal dengan tingkat akurasi yang lebih baik. Kata kunci: Clustering, K-Means, Sum of Square Error.References
L. Ramadhani, I. Purnamasari, and F. D. T. Amijaya, “Penerapan Metode Complete Linkage dan Metode Hierarchical Clustering Multiscale Bootstrap,” J. Eksponensial, vol. 9, no. 1, pp. 1–10, 2018.
M. Anggara, H. Sujaini, and H. Nasution, “Pemilihan distance measure Pada K-Means clustering Untuk Pengelompokkan member di Alvaro fitness,” JUSTIN (Jurnal Sist. dan Teknol. Informasi), vol. 4, no. 1, pp. 186–191, 2016.
K. Kameshwaran and K. Malarvizhi, “Survey on clustering techniques in data mining,” Int. J. Comput. Sci. Inf. Technol., vol. 5, no. 2, pp. 2272–2276, 2014.
A. Asroni, H. Fitri, and E. Prasetyo, “Penerapan Metode Clustering dengan Algoritma K-Means pada Pengelompokkan Data Calon Mahasiswa Baru di Universitas Muhammadiyah Yogyakarta (Studi Kasus: Fakultas Kedokteran dan Ilmu Kesehatan, dan Fakultas Ilmu Sosial dan Ilmu Politik),” Semesta Tek., vol. 21, no. 1, pp. 60–64, 2018.
E.-J. Lee and S. Y. Shin, “When do consumers buy online product reviews? Effects of review quality, product type, and reviewer’s photo,” Comput. Human Behav., vol. 31, pp. 356–366, 2014.
N. P. E. Merliana and A. J. Santoso, “Analisa Penentuan Jumlah Cluster Terbaik pada Metode K-Means Clustering,” 2015.
E. Fammaldo and L. Hakim, “Penerapan Algoritma K-Means Clustering Untuk Pengelompokan Tingkat Kesejahteraan Keluarga Untuk Program Kartu Indonesia Pintar,” J. Ilm. Teknol. Infomasi Terap., vol. 5, no. 1, pp. 23–31, 2018.
I. P. A. Pratama and A. Harjoko, “Penerapan algoritma invasive weed optimnization untuk penentuan titik pusat klaster pada K-Means,” IJCCS (Indonesian J. Comput. Cybern. Syst., vol. 9, no. 1, pp. 65–76, 2017.
X. Cui, T. E. Potok, and P. Palathingal, “Document clustering using particle swarm optimization,” in Proceedings 2005 IEEE Swarm Intelligence Symposium, 2005. SIS 2005., 2005, pp. 185–191.
A. K. Jain, “Data clustering: 50 years beyond K-means,” Pattern Recognit. Lett., vol. 31, no. 8, pp. 651–666, 2010.
R. Nainggolan and E. N. Purba, “Perbaikan Performa Cluster K-Means Menggunakan Sum Squared Error (SSE) Pada Analisis Online Customer Review Terhadap Produk Toko Online,” J. TIMES, vol. 8, no. 2, pp. 1–8, 2019.
R. T. Vulandari, Data Mining: Teori dan Aplikasi Rapidminer. Penerbit Gava Media, 2017.
Y. Agusta, “K-Means–Penerapan, Permasalahan dan Metode Terkait,” J. Sist. dan Inform., vol. 3, no. 1, pp. 47–60, 2007.
Downloads
Published
Issue
Section
License
Copyright (c) 2021 Leonardo Petra Refialy

This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.
License Terms
All articles published in Techno.COM Journal are licensed under the Creative Commons Attribution-NonCommercial 4.0 International (CC BY-NC 4.0). This means:
1. Attribution
Readers and users are free to:
-
Share – Copy and redistribute the material in any medium or format.
-
Adapt – Remix, transform, and build upon the material.
As long as proper credit is given to the original work by citing the author(s) and the journal.
2. Non-Commercial Use
-
The material cannot be used for commercial purposes.
-
Commercial use includes selling the content, using it in commercial advertising, or integrating it into products/services for profit.
3. Rights of Authors
-
Authors retain copyright and grant Techno.COM Journal the right to publish the article.
-
Authors can distribute their work (e.g., in institutional repositories or personal websites) with proper acknowledgment of the journal.
4. No Additional Restrictions
-
The journal cannot apply legal terms or technological measures that restrict others from using the material in ways allowed by the license.
5. Disclaimer
-
The journal is not responsible for how the published content is used by third parties.
-
The opinions expressed in the articles are solely those of the authors.
For more details, visit the Creative Commons License Page:
? https://creativecommons.org/licenses/by-nc/4.0/