Evaluasi Komparatif Model Embedding untuk Pencarian Semantik Dokumen Institusional Indonesia
DOI:
https://doi.org/10.26623/jprt.v10i1.14355Abstract
Penelitian ini menyajikan evaluasi komparatif terhadap berbagai model embedding dalam konteks pencarian semantik pada dokumen institusional berbahasa Indonesia. Permasalahan yang dikaji berkaitan dengan keterbatasan sistem pencarian tradisional berbasis kata kunci yang sering gagal mengambil dokumen relevan karena ketidaksesuaian kosakata antara kueri pengguna dan redaksi dokumen. Penelitian ini membandingkan Sentence-BERT, Multilingual E5, dan M3-Embedding pada skenario pengambilan dokumen Indonesia. Hasil evaluasi menunjukkan bahwa M3-Embedding (All) mengungguli model lain pada nDCG@10 dan Recall@100, sehingga pemilihan model perlu didasarkan pada evaluasi kontekstual dan spesifik domain



