2S-1
大規模な共起辞書に基づく文書分類システムの試作
○安藤哲志,藤井雄太郎,川口将吾,伊藤孝行(名工大)
近年,掲示板やブログといったユーザーが自由に投稿できるWebサイトが増加している.ユーザーが自由に投稿可能なWebサイトでは,未成年に有害な投稿がされることがあり問題となっている.多くのWebサイトでは,有害な記事が投稿されたのちに,人手の確認によって対応を行っている.しかし,人手による対応では運営コストが大きくなってしまう問題がある.
本稿では,有害な投稿記事を自動的に判定する手法の提案を行う.本稿での提案手法は,有害な文書である負例と有害では無い文書である正例から,共起情報を抽出した辞書を作成し,判定に用いる.