1U-2
強化学習を用いた人狼における最適戦略の抽出
○梶原健吾,鳥海不二夫,大橋弘忠(東大),大澤博隆(筑波大),片上大輔(東京工芸大),稲葉通将(広島市大),篠田孝祐,西野順二(電通大)
近年の人工知能の技術の発展により、チェスや将棋等の完全情報ゲームでは
人工知能が人間のプロを相手に勝利するようになった。
一方で、不完全情報ゲームについての研究は多くはない。
そこでコミュニケーションゲーム“人狼”に着目し、
人工知能が目指すべき新たな目標として設定する。
本研究ではこのゲーム内で使用される主な言葉をプロトコル化し、
各エージェントがそのプロトコルで会話をすることでゲームが進行される。
過去の会話内容やプレイヤー数等を環境とし、
発言内容や能力者の行動等の戦略をQ学習により学習させ、最適戦略を解析する。

footer 情報処理学会 セキュリティ プライバシーポリシー 倫理綱領 著作権について