抄録
E-010
模倣学習アルゴリズムを利用した階層構造カテゴリ文書の分類
松尾壮晃・岡崎威生(琉球大)・宮川 拓・中山康弘(タップ)
文書分類タスクでは、階層構造カテゴリが存在する場合においても、最終カテゴリを利用した非階層型のフラットモデルによる分類が行われることが多い。しかし企業等の組織は、独自の基準により管理する文書にしばしば階層的カテゴリを与えることも事実である。コーパスやドメインの持つ情報を最大限活用するためには、フラットモデルよりも階層的分類であるツリーモデルが望ましいと考えられる。一方でツリーモデルの分類には、上位のカテゴリ予測がそれ以降の下位カテゴリの分類予測に影響を与える誤り伝播の問題が指摘されている。本稿では、文書に含まれる単語数が多い場合においても、ツリーモデルでの誤り伝搬影響の低減を、模倣学習アルゴリズムの適用により示した。