抄録
D-007
偽陽性率に着目したオンライン学習を用いたスパム判別
数原良彦・鈴木 潤・片岡良治(NTT)
検索システムにおいては,悪意を持って作成されたスパムページが検索結果に混入することにより,ユーザの満足度を落とすおそれがある.そのため,検索システム提供者はあらかじめ検索対象のページについて判別を行い,スパムと判別されたページを事前に除去することで検索結果の品質向上を行う.この際,あらかじめラベル付けされた訓練データを用いて機械学習の枠組みで判別器を生成する方法が広く用いられている.本稿では,ウェブスパム判別において特に課題となる偽陽性率に着目し,偏りのある訓練データを用いた場合においても偽陽性率を
抑えつつ,高精度な学習が可能となるオンライン学習手法を提案する.