FIT2015第14回情報科学技術フォーラム 開催日:2015年9月15日(火)~17日(木) 会場:愛媛大学城北キャンパス
抄録
RD-001
低次元特徴空間におけるランダムフォレストを用いた書誌同一性判定の性能評価
中島良平(日立)・高須淳宏・安達 淳(NII)
書誌同一性判定とは論文の著者やタイトルなどの情報を含む書誌を2つ与えたとき,これらが共に同じ文献を参照しているか否かを判定する問題である.本稿は,提案した特徴量に対して特徴量選択を行い低次元な特徴空間を得て,ランダムフォレストを用いた書誌同一性判定手法を提案し,その性能を評価した.まず,書誌同一性判定を行うために実際の書誌データを分析し,25次元の特徴量を得る.それらの特徴量を入力としてランダムフォレストで書誌同一性判定の性能を評価した.次に特徴量選択を行い15次元特徴空間を得る.その空間でランダムフォレストを用いた書誌同一性判定の性能を評価し,25次元と同等の性能が出せることを確認した.実験により,23次元特徴空間でサポートベクタマシンを用いる既存手法よりも1%以上判定精度を改善する結果を得た.