Integrasi Peringkas Dokumen Otomatis Dengan Penggabungan Metode Fitur dan Metode Latent Semantic Analysis (LSA) Sebagai Feature Reduction

Junta Zeniarja, Abu Salam, Ardytha Luthfiarta, L Budi Handoko, Muhammad Jamhari

Abstract


Proses  clustering dokumen memudahkan pengguna menemukan dokumen yang diinginkan. Dalam prosesnya  dokumen  yang akan dicluster  direpresentasikan menggunakan Vector Space Model (VSM). Masalah  klasik  dalam VSM adalah matrik term-dokumen  yang  sangat jarang (banyak mengandung angka 0 dalam term-dokumen matrik) dan juga  berdimensi tinggi, sehingga dapat mengurangi kinerja clustering dokumen. Oleh karena itu diperlukan suatu metode untuk bisa mengurangi dimensi term-dokumen dan menghilangkan term yang bernilai 0 tersebut sehingga dapat meningkatkan kinerja proses clustering. Dalam penelitian ini diusulkan model peringkas dokumen otomatis  dengan penggabungan metode fitur dan latent semantic analysis (LSA) sebagai feature reduction pada proses clustering dokumen.Tujuan dari penelitian ini adalah untuk meningkatkan akurasi dari clustering dokumen dengan pengkombinasian metode padaperingkas dokumen otomatis yang diintegrasikan sebagai feature reduction. Beberapa tahapan clustering dalam penelitian ini, yaitu preprocessing, peringkas dokumen otomatis  dengan metode fitur ,LSA dan Kombinasi, pembobotan kata, feature selection, feature transformation dan algoritma clustering.   Hasil penelitian menunjukkan  tingkat akurasi menggunakan peringkas dokumen  otomatis yang diintegrasikan sebagai feature reduction  dengan menggabungkan metode fitur dan metode LSA  mencapai 93,33  %  yang diperoleh pada tingkat peringkas dokumen otomatis  LSA Summary + Feature Summary 50% + Feature Selection 20% + LSA  dibandingkan dengan feature selection 20 % tanpa menggunakan peringkas dokumen otomatis yang hanya mencapai tingkat akurasi 89,33 %.

Full Text:

PDF

Article Metrics

Abstract view : 228 times
PDF - 252 times

Refbacks

  • There are currently no refbacks.