6M-05
鉄道経営ゲームにおける思いやりある協調的動作の実現
○杉浦生隼,福田直樹(静岡大)
本研究では,強化学習によって,鉄道経営シミュレーションゲームのルールを学習したプレイヤーエージェントが「協調的な」行動を実現できるかを検証する.人間を含むマルチエージェント環境において,学習したプレイヤーエージェントが過度に人間プレイヤーに対して攻撃的な行動を選択することなく,人間プレイヤーの効用を考慮した上で,人間プレイヤーに配慮できる行動を選択できるかどうかを検証する.人間との対戦時においてプレイヤーエージェントが単純にゲームにおける勝利(総資産の最大化)を目指すのではなく,十分にプレイヤー(人間)に手加減をした上で行動するようなエージェントの行動であり,この行動のマルチエージェント強化学習を用いた手法による実現を狙う.

footer 著作権について 倫理綱領 プライバシーポリシー セキュリティ 情報処理学会