Peringkasan Teks Multi Dokumen Berbahasa Indonesia Menggunakan Sentence Scoring dan SVM

Deri Fauzi, Zainal Abidin, Fatchurrochman Fatchurrochman

Abstract


Berita online berasal dari berbagai sumber portal berita yang tersedia secara luas di dunia maya. Namun, berita online yang melimpah dapat mengesampingkan detail dan keakuratan berita karena tujuannya untuk memberikan informasi terkini sebanyak mungkin. Ketersediaan berita online di internet dapat menyebabkan penerimaan informasi yang berlebihan, memberikan pemahaman yang kurang jelas mengenai substansi berita tersebut. Oleh karena itu, penting untuk menemukan representasi dokumen berita online guna memahami inti dari berita tersebut. Penelitian ini fokus pada menghasilkan ringkasan berita online multi dokumen dari ekstraksi fitur dan proses klasifikasi menggunakan support vector machine. penelitian ini mengklasifikan berita multi dokumen menggunakan ekstraksi fitur Sentence Scoring dan SVM. Sentence Scoring digunakan untuk input pada metode SVM agar dapat melakukan proses klasifikasi untuk menentukan hasil ringkasan. Hasil pengujian menunjukkan bahwa Fold 3 memberikan hasil terbaik, dengan rata-rata Recall 0.946, Presisi 0.487, dan F-Measure 0.634. ROUGE-1 juga mencapai nilai tertinggi pada Fold 3, yaitu 0.946. Faktor kunci dalam hasil peringkasan adalah proses ekstraksi fitur menggunakan Sentence Scoring dan pelatihan data dengan SVM. Fitur seperti data numerik dan kemiripan antar kalimat berpengaruh signifikan terhadap hasil akhir dari peringkasan.


Keywords


Peringkasan Teks; Multi Dokumen; SVM; Berita Online

Full Text:

PDF

References


N. Hayatin, K. M. Ghufron, and G. W. Wicaksono, “Summarization of COVID-19 news documents deep learning-based using transformer architecture,” Telkomnika (Telecommunication Comput. Electron. Control., vol. 19, no. 3, pp. 754–761, 2021, doi: 10.12928/TELKOMNIKA.v19i3.18356.

R. C. Belwal, S. Rai, and A. Gupta, “Extractive text summarization using clustering-based topic modeling,” Soft Comput., 2022, doi: 10.1007/s00500-022-07534-6.

W. Widodo, M. Nugraheni, and I. P. Sari, “A comparative review of extractive text summarization in Indonesian language,” IOP Conf. Ser. Mater. Sci. Eng., vol. 1098, no. 3, p. 032041, 2021, doi: 10.1088/1757-899x/1098/3/032041.

T. M. P. Aulia, A. Jamaludin, and ..., “Extractive Text Summerization Pada Berita Berbahasa Indonesia Menggunakan Algoritma Support Vector Machine,” J-SAKTI (Jurnal Sains …, vol. 5, no. September, pp. 727–735, 2021, [Online]. Available: http://ejurnal.tunasbangsa.ac.id/index.php/jsakti/article/view/371.

A. Qaroush, I. Abu Farha, W. Ghanem, M. Washaha, and E. Maali, “An efficient single document Arabic text summarization using a combination of statistical and semantic features,” J. King Saud Univ. - Comput. Inf. Sci., vol. 33, no. 6, pp. 677–692, 2021, doi: 10.1016/j.jksuci.2019.03.010.

M. Gambhir and V. Gupta, “Recent automatic text summarization techniques: a survey,”

Artif. Intell. Rev., vol. 47, no. 1, pp. 1–66, 2017, doi: 10.1007/s10462-016-9475-9.

K. Kurniawan and S. Louvan, “I NDO S UM : A New Benchmark Dataset for Indonesian

Text Summarization,” 2018 Int. Conf. Asian Lang. Process., pp. 215–220, 2018.

E. Rainarli and K. E. Dewi, “Relevance Vector Machine for Summarization,” IOP Conf.

Ser. Mater. Sci. Eng., vol. 407, no. 1, 2018, doi: 10.1088/1757-899X/407/1/012075.

S. Mandal, P. Achary, S. Phalke, K. V. K. Poorvaja, and M. Kulkarni, “Extractive Text

Summarization Using Supervised Learning and Natural Language Processing,” 2021 Int.

Conf. Intell. Technol. CONIT 2021, pp. 1–7, 2021, doi:

1109/CONIT51480.2021.9498322.

N. S. Shirwandkar and S. Kulkarni, “Extractive Text Summarization Using Deep

Learning,” Proc. - 2018 4th Int. Conf. Comput. Commun. Control Autom. ICCUBEA 2018,

pp. 1–5, 2018, doi: 10.1109/ICCUBEA.2018.8697465.

P. Verma and H. Om, “A novel approach for text summarization using optimal

combination of sentence scoring methods,” Sadhana - Acad. Proc. Eng. Sci., vol. 44, no.

, 2019, doi: 10.1007/s12046-019-1082-4.




DOI: https://doi.org/10.62411/tc.v23i1.9648

Article Metrics

Abstract view : 0 times
PDF - 0 times

Refbacks

  • There are currently no refbacks.




Diterbitkan Oleh :

 

Jurnal Techno.Com terindex di :

    Screenshot-2024-02-11-at-17-10-53

Jurnal Teknologi Informasi Techno.Com (p-ISSN : 1412-2693, e-ISSN : 2356-2579) diterbitkan oleh LPPM Universitas Dian Nuswantoro Semarang. Jurnal ini di bawah lisensi Creative Commons Attribution 4.0 International License.