FIT2015第14回情報科学技術フォーラム 開催日:2015年9月15日(火)~17日(木) 会場:愛媛大学城北キャンパス
抄録
F-018
クエリ分布を考慮した一般化ピボット法の距離定義による特性評価
小林えり・斉藤和巳・池田哲夫(静岡県大)・青山一生・服部正嗣(NTT)
類似検索高速化法一つであるピボット法において、閲覧履歴などのユーザのクエリ分布を学習データに用いることで類似検索性能が向上することが確認されている。類似度は距離で定義され、距離定義の異なりが結果や性能面に影響を与えることが予想される。
本稿では、クエリ分布を考慮した一般化ピボット法において、距離定義の違いが結果にどう影響を及ぼすのかを検証する。実データを用いた実験により、マンハッタン距離定義での結果がユークリッド距離定義での結果よりも優れた性能を示し、クエリとデータオブジェクトとの下限値の分布が性能の差に関係していることを確認した。