6C-5
文脈木重み付け法を用いた半教師付き学習による文書分類の検討
○小畑智広,小林 学,渡邉重佳(湘南工科大)
文書分類問題は,ベクトル空間モデルやサポートベクターマシンなど
様々な手法により研究されてきた.一方,F.M.J.Willemsらにより提案
された文脈木重み付け法(以下CTW法と略す)は非常に優れた圧縮性能を
示し,文書分類に適用する手法が提案されている.
本研究では,各カテゴリ中の文書がそれぞれ制限された確率モデルから
生起することを仮定したうえで,学習データ数が十分でない場合を想定し,
CTW法を用いた文書分類に対して,カテゴリが未知のデータを用いた
半教師付き学習を行う手法を提案する.また新聞データを用いた計算機実験
を行い,正分類率によりその有効性を示す.

footer 情報処理学会 セキュリティ プライバシーポリシー 倫理綱領 著作権について