6Q-3
疑似ラベルを用いた潜在ディリクレ配分法の一考察
○鈴木聡子,小林一郎(お茶の水女子大)
ウェブ上には、テキストの大まかなカテゴリを示すタグがつけられている
ページが存在する。
このタグを文書内に潜在するトピックを抽出する情報として利用する手法
として、ラベルを用いた潜在ディリクレ配分法(Labeled-LDA)が
提案されており、従来のLDAよりトピック分類の精度が良いことが
報告されている。
ここで、Labeled-LDAにおいて、利用するタグは読み手が対象とする
テキストに付与した情報であり、多くの文書に対してタグが付与されている
ことは期待できない。そこで、本研究では、文書の中からトピック分類に
有用となる情報を抽出し、それを擬似ラベルとして利用し、Labeled-LDAと
同じ効果を及ぼすPseudo-Labeled LDAを提案し、従来の手法との比較
および考察をする。

footer 情報処理学会 セキュリティ プライバシーポリシー 倫理綱領 著作権について