Analisis Silhouette Coefficient pada 6 Perhitungan Jarak K-Means Clustering
DOI:
https://doi.org/10.33633/tc.v20i2.4556Keywords:
K-Means, Clustering, Silhouette CoefficientAbstract
Clustering merupakan proses pengelompokan sekumpulan data ke dalam klaster yang memiliki kemiripan. Kemiripan dalam satau klaster ditentukan dengan perhitungan jarak. Untuk melihat perfoma beberapa perhitungan jarak, dalam penelitian ini penulis menguji pada 6 data yang memiliki atribut berbeda, yakni 2, 3, 4, dan 6 atribut. Dari hasil uji perbandingan rumus jarak pada K-Means clustering menggunakan Silhouette coefficient dapat disimpulkan bahwa: 1) Chebyshev distance memiliki performa yang stabil baik untuk data dengan sedikit atribut maupun banyak. 2) Average distance memiliki hasil Silhouette coefficient paling tinggi dibandingkan dengan pengukuran jarak lain untuk data yang memiliki outliers seperti data 3. 3) Mean Character Difference mendapatkan hasil yang baik hanya untuk data dengan sedikit atribut. 4) Euclidean distance, Manhattan distance, dan Minkowski distance menghasilkan nilai baik untuk data yang memiliki sedikt atribut, sedangkan untuk data yang banyak atribut mendapatkan nilai cukup yang mendekati 0,5.References
Han, J., Kamber, M., 2006, Data Mining: Concepts and Techniques 2nd Edition, Elsevier
Nishom, M., 2019, Perbandingan Akurasi Euclidean Distance, Minkowski Distance, dan Manhattan Distance pada Algoritma K-Means Clustering berbasis Chi-Square, Jurnal Informatika: Jurnal Pengembangan IT (JPIT), Vol.04, No.01, hal 20-24.
Anggara, M., Sujiani, H. dan Nasution, H., 2016, Pemilihan Distance Measure Pada K-Means Clustering Untuk Pengelompokkan Member Di Alvaro Fitness, Jurnal Sistem dan Teknologi Informasi (JUSTIN), Vol. 1, No. 1, hal 1-6.
Statistik Indonesia, 2020, BPS-Statistics Indonesi, ISSN: 0126-2912
Statistik Pendidikan Provinsi Jawa Timur, 2019, BPS Provinsi Jawa Timur.
http://covid19.go.id diakses Februari 2021
Gan, G., Ma, C., and Wu, J., 2007, Data Clustering: Theory, Algorithms, and Applications, ASA-SIAM Series on Statistics and Applied Probability. Society for Industrial and Applied Mathematics, Alexandria, VA.
Struyf, A., Hubert, M., and Rousseeuw, P. J., 1997, Clustering in an Object-Oriented Environment, Journal of Statictical Software, Vol 1, Issue 4, 1-30.
Downloads
Published
Issue
Section
License
Copyright (c) 2021 Rahmatina Hidayati

This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.
License Terms
All articles published in Techno.COM Journal are licensed under the Creative Commons Attribution-NonCommercial 4.0 International (CC BY-NC 4.0). This means:
1. Attribution
Readers and users are free to:
-
Share – Copy and redistribute the material in any medium or format.
-
Adapt – Remix, transform, and build upon the material.
As long as proper credit is given to the original work by citing the author(s) and the journal.
2. Non-Commercial Use
-
The material cannot be used for commercial purposes.
-
Commercial use includes selling the content, using it in commercial advertising, or integrating it into products/services for profit.
3. Rights of Authors
-
Authors retain copyright and grant Techno.COM Journal the right to publish the article.
-
Authors can distribute their work (e.g., in institutional repositories or personal websites) with proper acknowledgment of the journal.
4. No Additional Restrictions
-
The journal cannot apply legal terms or technological measures that restrict others from using the material in ways allowed by the license.
5. Disclaimer
-
The journal is not responsible for how the published content is used by third parties.
-
The opinions expressed in the articles are solely those of the authors.
For more details, visit the Creative Commons License Page:
? https://creativecommons.org/licenses/by-nc/4.0/