情報処理学会 第83回全国大会 会期:2021年3月18日~20日 会場:オンライン開催 情報処理学会 第83回全国大会 会期:2021年3月18日~20日 会場:オンライン開催

4L-02
複数の類似度を考慮した木構造データに対する類似部分木検索
○小久保柚真,天笠俊之,北川博之(筑波大)
問合せとしてユーザが与えた木構造に対して,木構造データに含まれる全ての類似した部分木を見つける処理を類似部分木検索と呼ぶ.類似性を測るために,木構造の構造に基づく類似性と各ノードが持っているテキストに基づく類似性が考えられる.
類似部分木検索を扱った既存手法では,テキストの類似度としてリーフノードの単語の重複のみを考慮しており,単語の意味は全く考慮されていない.
本稿では,テキストの類似度として知識ベースなどの階層の最小共通祖先に基づく類似度と同義語規則を組み合わせた類似部分木検索手法を提案する.事前にデータセットを走査し,適用する類似度を決定することで,検索時の計算時間を削減する.