抄録
D-011
集合間類似度を用いたストリームデータのtop-k 類似検索における枝刈アルゴリズムの改善
野口大樹・古賀久志・戸田貴久(電通大)
近年,テクノロジーの進化によってストリームデータを解析する重要性が増してきている.
本研究では,データストリームの直近の要素集合をクエリとし,データベースから最も類似するk個のデータを検索する
問題を取り扱う.本問題に対しては,現在時刻の類似度の上限値を過去に計算した類似度から決定し,これを用いて上位k位に入る可能性があるデータに対してのみ類似度を計算する枝刈りベースの厳密解アルゴリズムが提案されている.
本研究では,この枝刈法の改善手法を提案する.提案手法では,従来手法よりも上限値をより正確に求めることにより類似度計算回数を減らし,類似検索を高速化する.