情報処理学会 第86回全国大会 会期:2024年3月15日~17日

1ZF-04
友好関係構築を目的としたユーザ適応行動学習エージェント
○三治祐太,佐久間拓人,加藤昇平(名工大)
本研究では人間と共生する対話システムにおけるユーザとの友好関係に着目した.大規模なデータを用いて学習された汎用モデルでは無難な行動が選択されやすく,個人にとっては必ずしも最適ではない.そこで本研究では友好関係構築のために,Profit sharingによる強化学習を用いてユーザからポジティブな反応を得るために効果的な行動を学習するエージェントを提案する.今回の実験においては行動の中でも発話のみを対象とし,斎藤の対人欲求-行動の円環図式に基づく8種類に分類された発話に対して学習する.行動選択は,ε-greedy法とSoftmax法を組み合わせることにより,一貫性を考慮しながら探索する.20代の学生20名を対象にシナリオ対話実験を実施した.