Perbaikan Kinerja Clustering K-Means pada Data Ekonomi Nelayan dengan Perhitungan Sum of Square Error (SSE) dan Optimasi nilai K cluster

Leonardo Petra Refialy, Hervin Maitimu, Melgusen Soyano Pesulima

Abstract


Clustering adalah jenismetode statistik yang dipakai untuk mengelompokan banyak data atau objek ke dalam beberapa kelompok (cluster), sehingga objek-objek yang berada dalam satu kelompok akan mempunyai kemiripan yang tinggi. Clustering K-Means merupakan metode pembentukan cluster berbasis data, dimana objek secara acak dalam cluster pertama yang terbentuk dijadikan sebagai titik tengah/titik pusat (centroid). K-means merupakan jenis cluster yang memiliki tingkat ketelitian dan efisiensi yang baik. Kelemahan dalam algoritma k-Means yaitu dalam menganalisa dan menentukan Nilai K dalam mengklaster data pada suatu dataset yang tidak optimal akan menghasilkan cluster yang buruk. Sum of Square Error (SSE) merupakan hasil penjumlahan dari seluruh jarak masing-masing data dengan titik pusat clusternya. Semakin kecil nilai SSE yang didapat, semakin seragam data yang ada didalam masing-masing cluster, semakin baik cluster yang dihasilkan. Penelitian ini melakukan  analisis cluster dengan K-means untuk menghasilkan kelompok cluster serta perhitungan nilai Sum of Square Error untuk setiap data dengan nilai K yang berbeda. Proses perhitungan nilai K dalam mencari nilai SSE yang minimum sehingga dapat dilakukan perhitungan selisih nilai SSE dari setiap nilai K cluster. Hasil perhitungan selisih tersebut sebagai penentu jumlah K cluster yang optimal dengan tingkat akurasi yang lebih baik.

 

Kata kunci: Clustering, K-Means, Sum of Square Error.


Keywords


Clustering, K-Means, Sum of Square Error WEKA

Full Text:

PDF

References


L. Ramadhani, I. Purnamasari, and F. D. T. Amijaya, “Penerapan Metode Complete Linkage dan Metode Hierarchical Clustering Multiscale Bootstrap,” J. Eksponensial, vol. 9, no. 1, pp. 1–10, 2018.

M. Anggara, H. Sujaini, and H. Nasution, “Pemilihan distance measure Pada K-Means clustering Untuk Pengelompokkan member di Alvaro fitness,” JUSTIN (Jurnal Sist. dan Teknol. Informasi), vol. 4, no. 1, pp. 186–191, 2016.

K. Kameshwaran and K. Malarvizhi, “Survey on clustering techniques in data mining,” Int. J. Comput. Sci. Inf. Technol., vol. 5, no. 2, pp. 2272–2276, 2014.

A. Asroni, H. Fitri, and E. Prasetyo, “Penerapan Metode Clustering dengan Algoritma K-Means pada Pengelompokkan Data Calon Mahasiswa Baru di Universitas Muhammadiyah Yogyakarta (Studi Kasus: Fakultas Kedokteran dan Ilmu Kesehatan, dan Fakultas Ilmu Sosial dan Ilmu Politik),” Semesta Tek., vol. 21, no. 1, pp. 60–64, 2018.

E.-J. Lee and S. Y. Shin, “When do consumers buy online product reviews? Effects of review quality, product type, and reviewer’s photo,” Comput. Human Behav., vol. 31, pp. 356–366, 2014.

N. P. E. Merliana and A. J. Santoso, “Analisa Penentuan Jumlah Cluster Terbaik pada Metode K-Means Clustering,” 2015.

E. Fammaldo and L. Hakim, “Penerapan Algoritma K-Means Clustering Untuk Pengelompokan Tingkat Kesejahteraan Keluarga Untuk Program Kartu Indonesia Pintar,” J. Ilm. Teknol. Infomasi Terap., vol. 5, no. 1, pp. 23–31, 2018.

I. P. A. Pratama and A. Harjoko, “Penerapan algoritma invasive weed optimnization untuk penentuan titik pusat klaster pada K-Means,” IJCCS (Indonesian J. Comput. Cybern. Syst., vol. 9, no. 1, pp. 65–76, 2017.

X. Cui, T. E. Potok, and P. Palathingal, “Document clustering using particle swarm optimization,” in Proceedings 2005 IEEE Swarm Intelligence Symposium, 2005. SIS 2005., 2005, pp. 185–191.

A. K. Jain, “Data clustering: 50 years beyond K-means,” Pattern Recognit. Lett., vol. 31, no. 8, pp. 651–666, 2010.

R. Nainggolan and E. N. Purba, “Perbaikan Performa Cluster K-Means Menggunakan Sum Squared Error (SSE) Pada Analisis Online Customer Review Terhadap Produk Toko Online,” J. TIMES, vol. 8, no. 2, pp. 1–8, 2019.

R. T. Vulandari, Data Mining: Teori dan Aplikasi Rapidminer. Penerbit Gava Media, 2017.

Y. Agusta, “K-Means–Penerapan, Permasalahan dan Metode Terkait,” J. Sist. dan Inform., vol. 3, no. 1, pp. 47–60, 2007.




DOI: https://doi.org/10.33633/tc.v20i2.4572

Article Metrics

Abstract view : 1605 times
PDF - 1667 times

Refbacks

  • There are currently no refbacks.




Diterbitkan Oleh :

 

Jurnal Techno.Com terindex di :

    Screenshot-2024-02-11-at-17-10-53

Jurnal Teknologi Informasi Techno.Com (p-ISSN : 1412-2693, e-ISSN : 2356-2579) diterbitkan oleh LPPM Universitas Dian Nuswantoro Semarang. Jurnal ini di bawah lisensi Creative Commons Attribution 4.0 International License.