IMPLEMENTASI INVERTED INDEX DENGAN SISTEM MANAJEMEN BASISDATA UNTUK MENDUKUNG MODEL PEMEROLEHAN BOOLEAN

JB Budi Darmawan

Abstract


Sistem pemerolehan informasi menawarkan kemampuan menyediakan informasi yang dibutuhkan pemakai. Kebanyakan sistem pemerolehan informasi dan mesin pencari web menggunakan inverted index yang terbukti sangat efisien untuk menjawab query. Implementasi sistem pemerolehan menggunakan sistem manajemen basisdata akan memperoleh kelebihan yang ditawarkan oleh RDBMS. Dalam paper ini peneliti
mencoba melakukan penerapan inverted index ke dalam RDBMS untuk mendukung model pemerolehan boolean untuk operasi dasar AND, OR dan NOT. Operasi SQL didukung dengan operasi relational algebra dicoba diterapkan pada RDBMS untuk mendukung query seperti yang diharapkan saat menggunakan
inverted index. Ujicoba dengan menggunakan corpus 5336 dokumen berita teknologi menghasilkan hampir 2 juta baris untuk penerapan inverted index ke dalam RDBMS. Implementasi operasi boolean dasar AND, OR atau NOT menunjukkan bahwa peningkatan jumlah operator boolean yang digunakan dari nol sampai enam membutuhkan waktu yang meningkat secara linier dengan tingkat korelasi di atas 0,99. Dengan spesifikasi sistem yang digunakan, untuk query dengan kata yang dimiliki sekitar 1 sampai 2 dokumen, waktu yang dibutuhkan untuk penggunaan satu operator sekitar 0,042 detik sampai sekitar 0,145 detik untuk enam operator. Sedangkan untuk query dengan kata yang dimiliki sekitar 5000 dokumen, waktu yang dibutuhkan untuk penggunaan satu operator sekitar 0,458 detik sampai sekitar 1,989 detik untuk enam operator. Salah satu alternatif penerapan inverted index ini dapat digunakan pada sistem yang sesuai
dengan kebutuhan.
Kata Kunci : Inverted index, Sistem pemerolehan boolean, DBMS, RDBMS

Full Text:

PDF

Article Metrics

Abstract view : 287 times
PDF - 259 times

Refbacks

  • There are currently no refbacks.