Perbaikan Kinerja Clustering K-Means pada Data Ekonomi Nelayan dengan Perhitungan Sum of Square Error (SSE) dan Optimasi nilai K cluster
DOI:
https://doi.org/10.33633/tc.v20i2.4572Keywords:
Clustering, K-Means, Sum of Square Error WEKAAbstract
Clustering adalah jenismetode statistik yang dipakai untuk mengelompokan banyak data atau objek ke dalam beberapa kelompok (cluster), sehingga objek-objek yang berada dalam satu kelompok akan mempunyai kemiripan yang tinggi. Clustering K-Means merupakan metode pembentukan cluster berbasis data, dimana objek secara acak dalam cluster pertama yang terbentuk dijadikan sebagai titik tengah/titik pusat (centroid). K-means merupakan jenis cluster yang memiliki tingkat ketelitian dan efisiensi yang baik. Kelemahan dalam algoritma k-Means yaitu dalam menganalisa dan menentukan Nilai K dalam mengklaster data pada suatu dataset yang tidak optimal akan menghasilkan cluster yang buruk. Sum of Square Error (SSE) merupakan hasil penjumlahan dari seluruh jarak masing-masing data dengan titik pusat clusternya. Semakin kecil nilai SSE yang didapat, semakin seragam data yang ada didalam masing-masing cluster, semakin baik cluster yang dihasilkan. Penelitian ini melakukan analisis cluster dengan K-means untuk menghasilkan kelompok cluster serta perhitungan nilai Sum of Square Error untuk setiap data dengan nilai K yang berbeda. Proses perhitungan nilai K dalam mencari nilai SSE yang minimum sehingga dapat dilakukan perhitungan selisih nilai SSE dari setiap nilai K cluster. Hasil perhitungan selisih tersebut sebagai penentu jumlah K cluster yang optimal dengan tingkat akurasi yang lebih baik. Kata kunci: Clustering, K-Means, Sum of Square Error.References
L. Ramadhani, I. Purnamasari, and F. D. T. Amijaya, “Penerapan Metode Complete Linkage dan Metode Hierarchical Clustering Multiscale Bootstrap,” J. Eksponensial, vol. 9, no. 1, pp. 1–10, 2018.
M. Anggara, H. Sujaini, and H. Nasution, “Pemilihan distance measure Pada K-Means clustering Untuk Pengelompokkan member di Alvaro fitness,” JUSTIN (Jurnal Sist. dan Teknol. Informasi), vol. 4, no. 1, pp. 186–191, 2016.
K. Kameshwaran and K. Malarvizhi, “Survey on clustering techniques in data mining,” Int. J. Comput. Sci. Inf. Technol., vol. 5, no. 2, pp. 2272–2276, 2014.
A. Asroni, H. Fitri, and E. Prasetyo, “Penerapan Metode Clustering dengan Algoritma K-Means pada Pengelompokkan Data Calon Mahasiswa Baru di Universitas Muhammadiyah Yogyakarta (Studi Kasus: Fakultas Kedokteran dan Ilmu Kesehatan, dan Fakultas Ilmu Sosial dan Ilmu Politik),” Semesta Tek., vol. 21, no. 1, pp. 60–64, 2018.
E.-J. Lee and S. Y. Shin, “When do consumers buy online product reviews? Effects of review quality, product type, and reviewer’s photo,” Comput. Human Behav., vol. 31, pp. 356–366, 2014.
N. P. E. Merliana and A. J. Santoso, “Analisa Penentuan Jumlah Cluster Terbaik pada Metode K-Means Clustering,” 2015.
E. Fammaldo and L. Hakim, “Penerapan Algoritma K-Means Clustering Untuk Pengelompokan Tingkat Kesejahteraan Keluarga Untuk Program Kartu Indonesia Pintar,” J. Ilm. Teknol. Infomasi Terap., vol. 5, no. 1, pp. 23–31, 2018.
I. P. A. Pratama and A. Harjoko, “Penerapan algoritma invasive weed optimnization untuk penentuan titik pusat klaster pada K-Means,” IJCCS (Indonesian J. Comput. Cybern. Syst., vol. 9, no. 1, pp. 65–76, 2017.
X. Cui, T. E. Potok, and P. Palathingal, “Document clustering using particle swarm optimization,” in Proceedings 2005 IEEE Swarm Intelligence Symposium, 2005. SIS 2005., 2005, pp. 185–191.
A. K. Jain, “Data clustering: 50 years beyond K-means,” Pattern Recognit. Lett., vol. 31, no. 8, pp. 651–666, 2010.
R. Nainggolan and E. N. Purba, “Perbaikan Performa Cluster K-Means Menggunakan Sum Squared Error (SSE) Pada Analisis Online Customer Review Terhadap Produk Toko Online,” J. TIMES, vol. 8, no. 2, pp. 1–8, 2019.
R. T. Vulandari, Data Mining: Teori dan Aplikasi Rapidminer. Penerbit Gava Media, 2017.
Y. Agusta, “K-Means–Penerapan, Permasalahan dan Metode Terkait,” J. Sist. dan Inform., vol. 3, no. 1, pp. 47–60, 2007.
Downloads
Published
Issue
Section
License
Copyright (c) 2021 Leonardo Petra Refialy
This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.
Pernyataan Lisensi
Artikel yang diterbitkan dalam jurnal Techno.Com dilisensikan di bawah Lisensi Creative Commons Atribusi-NonKomersial 4.0 Internasional (CC BY-NC 4.0).
Anda diperbolehkan untuk menyalin, mendistribusikan, menampilkan, dan melakukan karya dari artikel ini serta membuat karya turunan selama Anda memberikan kredit yang sesuai kepada penulis asli dan tidak menggunakan karya ini untuk tujuan komersial. Untuk melihat salinan lisensi ini, kunjungi [Creative Commons Attribution-NonCommercial 4.0 International](https://creativecommons.org/licenses/by-nc/4.0/).
---
Contoh pengkreditan:
- Penulis: [Nama Penulis]
- Judul Artikel: [Judul Artikel]
- Jurnal: Techno.Com, Vol. [Nomor Volume], No. [Nomor Edisi], Tahun [Tahun Penerbitan]
Jika Anda ingin menggunakan karya ini untuk tujuan komersial, Anda harus mendapatkan izin terlebih dahulu dari penulis atau penerbit.
---