Kombinasi Ekstraksi Kata Kunci dan Ekspansi Kueri Untuk Deteksi Isu Etik pada Ringkasan Penelitian Kesehatan

Mohammad Zaenuddin Hamidi, Diana Purwitasari, Ratih Nur Esti Anggraini

Abstract


Penelitian kesehatan harus melalui proses telaah etik yang bertujuan untuk mengantisipasi dugaan atas risiko fisik, sosial, ekonomi dan psikologis. Secara etik penelitian kesehatan dapat diterima apabila pada penelitian tersebut mampu dibuktikan dengan metode ilmiah yang valid serta lulus uji etik sebelum penelitian dilakukan. Untuk memastikan pada ringkasan penelitian kesehatan terdapat aspek etik, dibutuhkan kata kunci yang dapat dijadikan representasi dari isi ringkasan tersebut. Salah satu pendekatan yang sering dilakukan adalah dengan menghitung frekuensi kemunculan kata dalam dokumen. Pendekatan lain yaitu pendekatan YAKE dan keyBERT yang tidak hanya menghitung frekuensi kata namun juga menghitung konteks kata. Selain melakukan ekstraksi dilakukan juga proses ekspansi kueri sebagai upaya memperluas istilah yang dapat mewakili masing-masing aspek etik. Salah satu pendekatan yang digunakan untuk ekspansi kueri adalah model word2Vec. Penelitian ini mengusulkan metode pengembangan ekspansi kueri dengan dan metode ekstraksi kata kunci seperti TFIDF,YAKE dan keyBERT dan mengombinasikannya dengan fuzzy. Hasil eksperimen menunjukkan bahwa metode paling unggul secara presisi yaitu YAKE dan gabungan antara TFIDF + YAKE + keyBERT dengan nilai tertinggi 46% kemudian dari untuk recall model YAKE mendapat nilai tertinggi dengan angka 72% dan untuk nilai F1-Score yang paling unggul adalah metode YAKE dengan nilai tertinggi 54%.


Keywords


Ekspansi Kueri, Ekstraksi Kata Kunci, Fuzzy, Isu Etik

Full Text:

PDF

References


Lee, J., Yoon, W., Kim, S., Kim, D., Kim, S., So, C.H., Kang,J., 2020, BioBERT: A pre-trained biomedical language representation model for biomedical text mining, Bioinformatics, no. 4, vol. 36, 1234–1240, 2020.

Kementerian Kesehatan RI, 2017, Pedoman dan standar etik penelitian dan pengembangan kesehatan nasional,” Kementerian Kesehatan RI, 1–158.

Handayani, L. T., 2018, Kajian etik penelitian dalam bidang kesehatan dengan melibatkan manusia sebagai subyek, The Indonesian Journal Of Health Science, no. 1, vol. 10,47–54, 2018.

Budi S., 2017, Text mining untuk analisis sentimen review film menggunakan algoritma k-means,” Techno.Com, no. 1, vol. 16, 1–8.

Wahyudi, M. D. R., 2019, Penerapan Algoritma Cosine Similarity pada Text Mining Terjemah Al-Qur’an Berdasarkan Keterkaitan Topik, Semesta Tek., no. 1, vol. 22, 41–50.

Pavlopoulos, I.J., 2014, Aspect based sentiment analysis Ioannis, Thesis, Department Of Informatics, Athens University Of Economics And Business, Athena.

Priyantina, R.A., Sarno, R., 2019, Sentiment analysis of hotel reviews using latent dirichlet allocation, semantic similarity and LSTM, International Journal of Intelligent Engineering and System, no. 4, vol. 12, 142–155.

Rose, S., Engel , D., Cramer , N., Cowley, W., 2010, Automatic keyword extraction, Text Min. Appl. Theory, pp. 1-277.

Chamidah, N., Santoni, M., 2021, Pencocokan berbasis kata kunci pada penilaian esai pendek otomatis berbahasa indonesia, Techno.Com, no. 1, vol. 20, 19–27.

Laxmi, M. D., Indriati, Fauzi, M. A., 2019, Query expansion pada sistem temu kembali informasi berbahasa indonesia dengan metode pembobotan tf-idf dan algoritme cosine similarity berbasis wordnet, J. Pengemb. Teknol. Inf. Ilmu Komput, no. 1,vol. 3, 823–830.

Koloski, B., Pollak, S., Skrlj, B., Martinc, M., 2021, Extending neural keyword extraction with tf-idf tagset matching, EACL Hackashop News Media Content Anal. Autom. Rep. Gener. Hackashop 16th Conf. Eur. Chapter Assoc. Comput. Linguist. EACL.

Campos, R., Mangaravite, V., Pasquali A., Jorge,A., Nunes, C.,Jatowt ,A., 2020, YAKE: Keyword extraction from single documents using multiple local features,” Inf. Sci. (Ny)., vol. 509, 257–289.

Campos, R., Mangaravite, V., Pasquali A., Jorge,A., Nunes, C.,Jatowt ,A., 2018, A text feature based automatic keyword extraction method for single documents,” Lect. Notes Comput. Sci, no. 1, vol. 10772 LNCS,684–691, 2018.

Harwath T. J. H. M., 2012, Topic identification based extrinsic evaluation of summarization techniques applied to conversational speech, International Conference on Acoustics, Speech and Signal Processing.

Maryamah, Arifin, A.Z., Sarno, R., Indraswari, R.R., Sholikah, W.,2021, Pseudo-relevance feedback combining statistical and semantic term extraction for searching arabic documents, International Journal of Intelligent Engineering and System, no. 5, vol. 14, 238–246.

Perez, G.Y., A. Simon, C.W., Hojas, M.J., Olivas, A., Romero, F. P., 2018, A fuzzy approach to improve an unsupervised automatic keyphrase extraction process, IEEE Int. Conf. Fuzzy Syst, 2018-July.

Sheeba, J. I., 2014, A fuzzy logic based improved keyword extraction from meeting transcripts, International Journal on Computer Science and Engineering, no. 08, vol. 6, 287–299.




DOI: https://doi.org/10.33633/tc.v22i1.7268

Article Metrics

Abstract view : 261 times
PDF - 188 times

Refbacks

  • There are currently no refbacks.




Diterbitkan Oleh :

 

Jurnal Techno.Com terindex di :

    Screenshot-2024-02-11-at-17-10-53

Jurnal Teknologi Informasi Techno.Com (p-ISSN : 1412-2693, e-ISSN : 2356-2579) diterbitkan oleh LPPM Universitas Dian Nuswantoro Semarang. Jurnal ini di bawah lisensi Creative Commons Attribution 4.0 International License.