抄録
CA-005
符号理論に基づく多値文書分類における二値判別器の相関に着目した符号語構成法
雲居玄道(早大)・八木秀樹(電通大)・後藤正幸・平澤茂一(早大)
文書の自動分類問題において,分類対象とするカテゴリが複数存在する多値判別問題がある.その問題の解決において高性能な二値判別器が存在することから,この二値判別器を多値判別問題に適用する方法として,多値分類問題を二値分類器の集合の構成に落とし込み,符号理論の枠組みを利用する手法が研究されている.この手法は多値文書分類に対して有効であるが,二値判別器の構成を意味する符号語構成が最終的な分類性能に影響を与える.
本研究では,文書分類問題を対象に,各二値判別器に相関が存在することに着目した符号表構成法を提案し,評価実験よりその有効性を示す.