6R-8
文脈木重み付け法を用いた文書分類の検討
○小畑智広,池上裕之,小林 学,坂下善彦(湘南工科大)
文書分類問題は,ベクトル空間モデルやサポートベクターマシンなど様々な手法により研究されてきた.一方,優れたデータ圧縮法として文脈木重み付け法が提案されており,これを文書分類に適用する手法が提案されている.本研究では,各カテゴリ中の文書がそれぞれ制限された確率モデルから生起することを仮定し,文脈木重み付け法を用いた文書分類手法を検討する.また新聞データを用いた計算機実験を行い,正分類率によりその有効性を示す.