6Q-4
潜在情報を考慮したグラフに基づく半教師あり学習によるテキスト分類
○江里口瑛子,小林一郎(お茶の水女子大)
本研究では、文書データの自動カテゴリ分類を行うことを目的とする。分類手法は、
文書データのグラフ構造に従い、少量のラベルありデータからラベルなしデータの
ラベル推定を行う、グラフ構造に基づく半教師あり学習を用いる。文書間の類似度
グラフは、従来の表層情報に潜在情報を加えたものを使用する。また、PageRank
の概念を用いて、潜在情報に基づくラベルありデータのランキング付けを行い、
上位のデータをラベルありデータに採用することで、文書の潜在情報を考慮した
グラフに基づくテキスト分類手法を提案する。データセットには新聞記事
Reuters-21578を用い、実験を通じて他の手法との比較を示し、提案手法の
有効性を検討する。

footer 情報処理学会 セキュリティ プライバシーポリシー 倫理綱領 著作権について