3N-2
ベイズ分類器のスコアを素性に用いたSVMによる有害文書分類手法
○藤井雄太郎,吉村卓也,伊藤孝行(名工大)
近年,掲示板や SNS 等,ユーザが自由に読み書きできるサイトが増加しており,未成年に対して悪影響を及ぼす情報が送受信されている事が問題となっている.多くのサイトでは人の目視による対処しか行われていないため,時間等のコストがかかってしまう.そこで,本研究では有害な書き込みを自動的に分類する手法を提案する.また本稿では,性的な描写を含む文書を分類対象とする.一般的に, SVMを用いた文書分類では,単語の出現頻度を素性としているが,本稿で提案する手法は, SVMの素性にベイズ分類器のGraham方式とRobinson 方式によって計算した文書の有害確率を素性にし,分類を行う.