IMPLEMENTASI CROSS METHOD LATENT SEMANTIC ANALYSIS UNTUK MERINGKAS DOKUMEN BERITA BERBAHASA INDONESIA

Fernando Winata, Ednawati Rainarli

Abstract


Penelitian mengenai peringkasan teks secara otomatis sampai saat ini masih terus dilakukan dengan harapan hasil ringkasan yang dihasilkan oleh mesin dapat mendekati ringkasan yang dihasilkan oleh manusia. Salah satu metode yang digunakan untuk menghasilkan ringkasan dengan bantuan mesin adalah metode Latent Semantic Analysis (LSA) yang menerapkan konsep Singular Value Decomposition untuk pemilihan ringkasan yang dihasilkan, tetapi dari beberapa hasil pengujian yang telah dilakukan terhadap metode ini dapat diketahui bahwa tingkat akurasi dari ringkasan yang dihasilkan masih dapat ditingkatkan kembali. Cross Method Latent Semantic Analysis (CMLSA) merupakan pengembangan dari metode LSA yang dianggap dapat menghasilkan ringkasan dengan tingkat akurasi yang lebih tinggi dari metode LSA. Untuk menguji seberapa baik ringkasan yang dihasilkan maka dibuatlah simulator peringkas teks otomatis dengan menggunakan CMLSA sebagai metode peringkasan sedangkan teks yag digunakan sebagai masukan adalah teks berita yang diambil dari portal berita viva.co.id. Dari hasil penelitian ini dapat diketahui bahwa rata – rata nilai performansi dari ringkasan yang dihasilkan dengan menggunakan metoede pengujian Precision, Recall dan F-Measure adalah nilai Precision sebesar 72,25%, nilai Recall sebesar 66,7% dan nilai F-Measure sebesar 69,6%, hasil ringkasan dengan menggunakan metode ini dengan akurasi ringkasan sebesar 69,6% dianggap cukup baik.

Kata Kunci: cross method latent semantic analysis, TF-IDF, automatic text summarization, natural language processing.

 


Full Text:

PDF

References


Y Gong and X Liu, "Generic Text Summarization Using Relevance Measure and Latent Semantic," Proceedings of the 24th Annual International ACM SIGIR Conference on Research and Developement in Information Retrieval, pp. 19 - 25, 2001.

Karel Jezek Josef Steinberger, "Using Latent Semantic Analysis in Text Summarization and Summary Evaluation," Proceedings of ISIM, pp. 93-100, 2004.

Steve Renals, Jean Carletta Gabriel Murray, "Extractive Summarization of Meeting Recordings," 2005.

Makbule Gulcin Ozsoy, Ilyas Cicekli, and Ferda Nur Alp, "Text Summarization of Turkish Texts Using Latent Semantic Analysis," Proceedings of the 23rd international conference on computational linguistics, pp. 869 - 876, 2010.

Junta Zeniarja, Abu Salam Ardytha Luthfiarta, "Algoritma Latent Semantic Analysis (LSA) Pada Peringkas Dokumen Otomatis Untuk Proses Clustering Dokumen," Semantik, vol. 3, no. 1, pp. 61-68, 2013.

Adiwijawa, Moch Arif Bijaksana Agung Triwibowo, "Penggunaan Metode Relevance Measure Dan Latent Semantic Analysis (LSA) Dalam Membuat Ikhtisar Dokumen Berita," 2010.

Andre F.T. Martins Dipanjan Das, "A Survey on Automatic Text Summarization," Literature Survey for the Language and Statistics II course at CMU, vol. 4, pp. 192 - 195, November 2007.

J. Ilamathi, Nithya Vijayarani, "Preprocessing Techniques for Text Mining," International Journal of Computer Science and Communication Network, vol. 5, no. 1, pp. 7-16, 2015.

Vikram Singh and Balwinder Saini, "An Effective Pre-Processing Algorithm For Information Retrieval Systems," International Journal of Database Management Systems, vol. 6, no. 6, p. 13, 2014.

Fadillah Z Tala, "A Study of Stemming Effects on Information Retrieval in Bahasa Indonesia," 2003.

Gregoria Ariyanti, "Dekomposisi Nilai Singular dan Aplikasinya," Prosiding Seminar Nasional Matematika dan Pendidikan Matematika (2010):†Peningkatan Kontribusi Penelitian dan Pembelajaran Matematika dalam Upaya Pembentukan Karakter Bangsaâ€, 2010.

Manabu Okumura Takahiro Fukusima, "Text Summarization Challenge Text Summarization Evaluation in Japan," North American Association for Computational Linguistics (NAACL2001), Workshop on Automatic Summarization, pp. 51 - 59, 2001.

Karel Jezek Josef Steinberg, "Evaluation Measures for Text Summarization," Computing and Informatics, vol. 28, no. 2, pp. 251 - 275, 2009.




DOI: https://doi.org/10.33633/tc.v15i4.1227

Article Metrics

Abstract view : 878 times
PDF - 880 times

Refbacks

  • There are currently no refbacks.




Diterbitkan Oleh :

 

Jurnal Techno.Com terindex di :

    Screenshot-2024-02-11-at-17-10-53

Jurnal Teknologi Informasi Techno.Com (p-ISSN : 1412-2693, e-ISSN : 2356-2579) diterbitkan oleh LPPM Universitas Dian Nuswantoro Semarang. Jurnal ini di bawah lisensi Creative Commons Attribution 4.0 International License.