情報処理学会第76回全国大会講演要旨

1U-2

強化学習を用いた人狼における最適戦略の抽出

○梶原健吾，鳥海不二夫，大橋弘忠（東大），大澤博隆（筑波大），片上大輔（東京工芸大），稲葉通将（広島市大），篠田孝祐，西野順二（電通大）

近年の人工知能の技術の発展により、チェスや将棋等の完全情報ゲームでは
人工知能が人間のプロを相手に勝利するようになった。
一方で、不完全情報ゲームについての研究は多くはない。
そこでコミュニケーションゲーム“人狼”に着目し、
人工知能が目指すべき新たな目標として設定する。
本研究ではこのゲーム内で使用される主な言葉をプロトコル化し、
各エージェントがそのプロトコルで会話をすることでゲームが進行される。
過去の会話内容やプレイヤー数等を環境とし、
発言内容や能力者の行動等の戦略をQ学習により学習させ、最適戦略を解析する。

情報処理学会 第76回全国大会講演要旨

情報処理学会第76回全国大会講演要旨