抄録
E-019
品詞分布を用いた日本語文書のジャンル分類
白井匡人・島田 諭・三浦孝夫(法大)
本研究では名詞の割合の事前分布にガウス分布を用いたジャンル分類を提案する.単語の頻度を用いる分類では数万次元の単語分布を比較する必要があったのに対し,本手法では品詞分布を用いるため品詞の種類数の次元で分類が行える.これにより,ストリームデータのように各ジャンルの特徴が逐次変化する場合でもパラメータの更新が容易となる.日本語文書の名詞に対する他の品詞の割合には相関関係があるため、各ジャンルの特徴として用いる.実験により有効性を示す.