Kombinasi Ekstraksi Kata Kunci dan Ekspansi Kueri Untuk Deteksi Isu Etik pada Ringkasan Penelitian Kesehatan
DOI:
https://doi.org/10.33633/tc.v22i1.7268Keywords:
Ekspansi Kueri, Ekstraksi Kata Kunci, Fuzzy, Isu EtikAbstract
Penelitian kesehatan harus melalui proses telaah etik yang bertujuan untuk mengantisipasi dugaan atas risiko fisik, sosial, ekonomi dan psikologis. Secara etik penelitian kesehatan dapat diterima apabila pada penelitian tersebut mampu dibuktikan dengan metode ilmiah yang valid serta lulus uji etik sebelum penelitian dilakukan. Untuk memastikan pada ringkasan penelitian kesehatan terdapat aspek etik, dibutuhkan kata kunci yang dapat dijadikan representasi dari isi ringkasan tersebut. Salah satu pendekatan yang sering dilakukan adalah dengan menghitung frekuensi kemunculan kata dalam dokumen. Pendekatan lain yaitu pendekatan YAKE dan keyBERT yang tidak hanya menghitung frekuensi kata namun juga menghitung konteks kata. Selain melakukan ekstraksi dilakukan juga proses ekspansi kueri sebagai upaya memperluas istilah yang dapat mewakili masing-masing aspek etik. Salah satu pendekatan yang digunakan untuk ekspansi kueri adalah model word2Vec. Penelitian ini mengusulkan metode pengembangan ekspansi kueri dengan dan metode ekstraksi kata kunci seperti TFIDF,YAKE dan keyBERT dan mengombinasikannya dengan fuzzy. Hasil eksperimen menunjukkan bahwa metode paling unggul secara presisi yaitu YAKE dan gabungan antara TFIDF + YAKE + keyBERT dengan nilai tertinggi 46% kemudian dari untuk recall model YAKE mendapat nilai tertinggi dengan angka 72% dan untuk nilai F1-Score yang paling unggul adalah metode YAKE dengan nilai tertinggi 54%.References
Lee, J., Yoon, W., Kim, S., Kim, D., Kim, S., So, C.H., Kang,J., 2020, BioBERT: A pre-trained biomedical language representation model for biomedical text mining, Bioinformatics, no. 4, vol. 36, 1234–1240, 2020.
Kementerian Kesehatan RI, 2017, Pedoman dan standar etik penelitian dan pengembangan kesehatan nasional,” Kementerian Kesehatan RI, 1–158.
Handayani, L. T., 2018, Kajian etik penelitian dalam bidang kesehatan dengan melibatkan manusia sebagai subyek, The Indonesian Journal Of Health Science, no. 1, vol. 10,47–54, 2018.
Budi S., 2017, Text mining untuk analisis sentimen review film menggunakan algoritma k-means,” Techno.Com, no. 1, vol. 16, 1–8.
Wahyudi, M. D. R., 2019, Penerapan Algoritma Cosine Similarity pada Text Mining Terjemah Al-Qur’an Berdasarkan Keterkaitan Topik, Semesta Tek., no. 1, vol. 22, 41–50.
Pavlopoulos, I.J., 2014, Aspect based sentiment analysis Ioannis, Thesis, Department Of Informatics, Athens University Of Economics And Business, Athena.
Priyantina, R.A., Sarno, R., 2019, Sentiment analysis of hotel reviews using latent dirichlet allocation, semantic similarity and LSTM, International Journal of Intelligent Engineering and System, no. 4, vol. 12, 142–155.
Rose, S., Engel , D., Cramer , N., Cowley, W., 2010, Automatic keyword extraction, Text Min. Appl. Theory, pp. 1-277.
Chamidah, N., Santoni, M., 2021, Pencocokan berbasis kata kunci pada penilaian esai pendek otomatis berbahasa indonesia, Techno.Com, no. 1, vol. 20, 19–27.
Laxmi, M. D., Indriati, Fauzi, M. A., 2019, Query expansion pada sistem temu kembali informasi berbahasa indonesia dengan metode pembobotan tf-idf dan algoritme cosine similarity berbasis wordnet, J. Pengemb. Teknol. Inf. Ilmu Komput, no. 1,vol. 3, 823–830.
Koloski, B., Pollak, S., Skrlj, B., Martinc, M., 2021, Extending neural keyword extraction with tf-idf tagset matching, EACL Hackashop News Media Content Anal. Autom. Rep. Gener. Hackashop 16th Conf. Eur. Chapter Assoc. Comput. Linguist. EACL.
Campos, R., Mangaravite, V., Pasquali A., Jorge,A., Nunes, C.,Jatowt ,A., 2020, YAKE: Keyword extraction from single documents using multiple local features,” Inf. Sci. (Ny)., vol. 509, 257–289.
Campos, R., Mangaravite, V., Pasquali A., Jorge,A., Nunes, C.,Jatowt ,A., 2018, A text feature based automatic keyword extraction method for single documents,” Lect. Notes Comput. Sci, no. 1, vol. 10772 LNCS,684–691, 2018.
Harwath T. J. H. M., 2012, Topic identification based extrinsic evaluation of summarization techniques applied to conversational speech, International Conference on Acoustics, Speech and Signal Processing.
Maryamah, Arifin, A.Z., Sarno, R., Indraswari, R.R., Sholikah, W.,2021, Pseudo-relevance feedback combining statistical and semantic term extraction for searching arabic documents, International Journal of Intelligent Engineering and System, no. 5, vol. 14, 238–246.
Perez, G.Y., A. Simon, C.W., Hojas, M.J., Olivas, A., Romero, F. P., 2018, A fuzzy approach to improve an unsupervised automatic keyphrase extraction process, IEEE Int. Conf. Fuzzy Syst, 2018-July.
Sheeba, J. I., 2014, A fuzzy logic based improved keyword extraction from meeting transcripts, International Journal on Computer Science and Engineering, no. 08, vol. 6, 287–299.
Downloads
Published
Issue
Section
License
Pernyataan Lisensi
Artikel yang diterbitkan dalam jurnal Techno.Com dilisensikan di bawah Lisensi Creative Commons Atribusi-NonKomersial 4.0 Internasional (CC BY-NC 4.0).
Anda diperbolehkan untuk menyalin, mendistribusikan, menampilkan, dan melakukan karya dari artikel ini serta membuat karya turunan selama Anda memberikan kredit yang sesuai kepada penulis asli dan tidak menggunakan karya ini untuk tujuan komersial. Untuk melihat salinan lisensi ini, kunjungi [Creative Commons Attribution-NonCommercial 4.0 International](https://creativecommons.org/licenses/by-nc/4.0/).
---
Contoh pengkreditan:
- Penulis: [Nama Penulis]
- Judul Artikel: [Judul Artikel]
- Jurnal: Techno.Com, Vol. [Nomor Volume], No. [Nomor Edisi], Tahun [Tahun Penerbitan]
Jika Anda ingin menggunakan karya ini untuk tujuan komersial, Anda harus mendapatkan izin terlebih dahulu dari penulis atau penerbit.
---