IMPLEMENTASI INVERTED INDEX DENGAN SISTEM MANAJEMEN BASISDATA UNTUK MENDUKUNG MODEL PEMEROLEHAN BOOLEAN

Authors

  • JB Budi Darmawan Jurusan Teknik Informatika, Fakultas Sains dan Teknologi, Universitas Sanata Dharma

Abstract

Sistem pemerolehan informasi menawarkan kemampuan menyediakan informasi yang dibutuhkan pemakai. Kebanyakan sistem pemerolehan informasi dan mesin pencari web menggunakan inverted index yang terbukti sangat efisien untuk menjawab query. Implementasi sistem pemerolehan menggunakan sistem manajemen basisdata akan memperoleh kelebihan yang ditawarkan oleh RDBMS. Dalam paper ini penelitimencoba melakukan penerapan inverted index ke dalam RDBMS untuk mendukung model pemerolehan boolean untuk operasi dasar AND, OR dan NOT. Operasi SQL didukung dengan operasi relational algebra dicoba diterapkan pada RDBMS untuk mendukung query seperti yang diharapkan saat menggunakaninverted index. Ujicoba dengan menggunakan corpus 5336 dokumen berita teknologi menghasilkan hampir 2 juta baris untuk penerapan inverted index ke dalam RDBMS. Implementasi operasi boolean dasar AND, OR atau NOT menunjukkan bahwa peningkatan jumlah operator boolean yang digunakan dari nol sampai enam membutuhkan waktu yang meningkat secara linier dengan tingkat korelasi di atas 0,99. Dengan spesifikasi sistem yang digunakan, untuk query dengan kata yang dimiliki sekitar 1 sampai 2 dokumen, waktu yang dibutuhkan untuk penggunaan satu operator sekitar 0,042 detik sampai sekitar 0,145 detik untuk enam operator. Sedangkan untuk query dengan kata yang dimiliki sekitar 5000 dokumen, waktu yang dibutuhkan untuk penggunaan satu operator sekitar 0,458 detik sampai sekitar 1,989 detik untuk enam operator. Salah satu alternatif penerapan inverted index ini dapat digunakan pada sistem yang sesuaidengan kebutuhan.Kata Kunci : Inverted index, Sistem pemerolehan boolean, DBMS, RDBMS

Downloads

Published

2011-04-16