抄録
E-016
極性を考慮した同義語による文書分類
逆瀬川滉大・廣川佐千男(九大)
同義語を同一視することで文書分類の性能が向上する事が知られている。さらに共通の上位概念の単語群を同一視した属性の導入で、文書分類の識別性能が上がる事が知られている。しかし、正例負例に2値分類する問題を扱うとき、同義語であっても正例の特徴語であったり負例の特徴語であったりする可能性もある。本発表では正例負例の極性も考慮した同義語による属性選択を提案し20newsgroupデータセットについて性能向上を評価した。