1D-4
WebニュースからのLDAに基づく興味学習手法
○東原智幸,渥美雅保(創価大)
文書の生成過程を確率的にモデル化したトピックモデルが,文書分類,
推薦システムなど,さまざまな分野に適用されている.代表的な手法
であるLDAでは,文書を複数のトピックの混合により表現し,その混合確率を
単語頻度データより学習している.本論文では, WEBニュースに対する
ユーザの興味応答から,興味有集合,興味無集合に分割し,各集合に対して
LDAを適用し,興味有トピック,無トピック間の距離からユーザの興味を
モデル化する手法を提案する.そして,LDAに入力される特徴量の違いや
単語データの選択による興味トピック抽出結果への影響,
手法の有効性について評価する.