1N-01
Soft Actor-Critic 強化学習を用いた系列推薦フレームワーク
○洪 惠珍,木村優介,波多野賢治(同志社大)
近年の推薦システムでは,ユーザの次の行動を予測する系列推薦に強化学習を利用することで推薦性能が向上することが知られている.系列推薦システムにおける強化学習は,ユーザの嗜好の変化を把握することが重要であリ,その行動パターンを効率的に学習できるSoft Actor-Critic (SAC) が注目されている.しかし,SAC を系列推薦に適用すると,推薦項目の選択に対応する価値が過大評価される可能性がある.そこで,本研究ではSAC を系列推薦に適用するために,推薦項目を選択する環境とその選択に対応する価値を共有する系列推薦フレームワークを提案する.