5S-3
複数単語間の距離情報及び共起情報を利用した文書分類手法の提案
○藤井雄太郎,安藤哲志,伊藤孝行(名工大)
近年,ソーシャル・ネットワーキング・サービス(SNS)やブログ等では,未成年にとって悪影響を及ぼすような書き込みや画像,または動画などの存在が問題となっている.そのため,効率的かつ自動的に有害な情報を適切に判別し,人への負担を軽減するための研究が進められている .本稿では,掲示板等の文章に注目し有害な情報の判別を行う.文章中の複数単語間の共起情報、距離情報に加え、グレイワードという概念を定義し、それらを用いた有害文書分類手法を提案する.また,今回判別する文章の対象として,過度な性的描写を含む文章とする.