6D-04
タスク差異がRAGシステムのインデックス設計の有効性に与える影響分析
○長谷 亮,遠藤隆夫,乙村浩太郎,中村光佑,羽藤淳平(三菱電機)
質問回答向けのRAGシステムでは、質問タスクに関連する情報をドキュメント群から検索し、LLMの入力として活用することで回答品質の向上を図る。ドキュメント群をRAGシステムの検索対象とするためには、各ドキュメントを読み込んで前処理やチャンク化を行い、インデックスを作成する。しかし、質問タスクの特性に応じて、適切なチャンクサイズなどのインデックスの設計は異なる場合がある。本稿では、RAGシステムの評価に用いるオープンデータセットから複数の質問タスクを抽出し、RAGシステムの検索機能および生成機能に関する実験を行い、質問タスクの種別ごとに有効なインデックスの設計の傾向を分析した結果を示す。