2P-1
クラスタリングを利用したTop-k Join処理
○鈴木貴敦(東大),高須淳宏,安達 淳(国立情報学研)
Complex Search Taskでは,複数の異なる情報源から得られた順位付きリストを
joinすることでクエリへの回答を作成する.この際には,異なる情報源からの
データをjoinするため,必ずしも全てのオブジェクト同士がjoin可能であるとは
限らない.そのため,欠損を許容した組み合わせを効率的に求める手法が必要である.
本稿では,階層的クラスタリングを応用したTop-k Joinの効率化手法を提案する.
既存手法では,順位付きリストを一括してjoin処理をする.それに対して本手法では,
各クラスタごとに非同期に処理が進められるため,順位付きリストが全て揃わなくても
処理を始められる利点が挙げられる.