4N-4
Valable LCA探索のためのサイズを考慮した索引構成
○小林 径,横田治夫(東工大)
XML文書に対するキーワード検索は有用であるが,それを行う際
には,全検索語を含む適切な部分木を抽出することが重要である.
その方法の1つとして,VLCAを根とする部分木を抽出する方法
が提案されているが,既存の抽出手法はその性能に問題がある.本
稿では,ノードと索引付けされるノード間に出現するXMLタグ名
の情報を格納する索引において,大きくなる索引サイズを削減する
構成方法を検討する.同一ノードに対するシグネチャの重複配置を
無くす方法,同一ノードの情報の重複配置を無くす方法,並びにX
MLノードのシグネチャ長を減少する方法を示す.さらに,検索語
数を増加した場合の処理について検討する.既存手法との比較実験
を行い,その効果を示す.