佐藤 直之 佐世保工業高等専門学校 電子制御工学科 助教 |
[背景]ゲームAIの学術における研究対象技術と産業における実用技術の乖離
[問題]学術と産業の技術乖離の解消およびAI技術の適用範囲拡張
[貢献]ゲームAIの4分割された下位クラスの課題解決による技術適用範囲の拡張
初期のゲームAI研究はチェスやチェッカーなど単純なボードゲームに着目したもの,かつ単純に強さの向上を目的としたものが多かった.それから次第に囲碁やビデオゲーム等の複雑さを増したジャンルにまで対象を広げていき,AIの目指す目的も「人と遊んで楽しい」「人間の振る舞いに近いもの」等の広がりを見せるようになった.
しかしゲームAI研究の成果が実際の商業タイトルのゲーム開発の現場に十分還元されているかは疑問である.多くの商用のゲームにおいてキャラクタはハンドコーディングによって挙動が管理されているように見え,学術的な手法(機械学習等)の適用は稀であると判断している.
そこで本研究は既存のゲームAI研究の対象と目的の裾野を広げるとともに,商業的な場における応用可能性を意識して,4つのゲームにおける課題解決に「なるべく原理が単純な手法」により取り組んだ.本研究の具体的な取り組みを以下にまとめる.
しかしゲームAI研究の成果が実際の商業タイトルのゲーム開発の現場に十分還元されているかは疑問である.多くの商用のゲームにおいてキャラクタはハンドコーディングによって挙動が管理されているように見え,学術的な手法(機械学習等)の適用は稀であると判断している.
そこで本研究は既存のゲームAI研究の対象と目的の裾野を広げるとともに,商業的な場における応用可能性を意識して,4つのゲームにおける課題解決に「なるべく原理が単純な手法」により取り組んだ.本研究の具体的な取り組みを以下にまとめる.
- ターン制ストラテジーゲームはチェスや将棋のようにターン制のボードゲームの一種である.ただし複数の駒を好きな順序で動かせるルールのため手番ごとの可能な行動の組合せが膨大となり,コンピュータにとって難しい.既存研究はその膨大な組み合わせの総数に対してモンテカルロ木探索で対応することがほとんどだったが,本研究ではαβ法の適用で既存手法たちを上回る性能のAI設計に成功した.
- RPGゲームは「攻撃」「回復」などのコマンドを選び,チームで戦う形式のジャンルである.このゲームでは,人間プレイヤが個人ごとに異なる嗜好をもって戦いを進めるという点が,仲間役のAIにとっては難しい.既存研究では人間プレイヤと仲間役のAIの「協調」という点にはあまり着目されなかった.本研究は人間プレイヤの行動履歴を参照し,モンテカルロシミュレーションを適用することでそのプレイヤ個人の嗜好を推測し,それに協調するAI設計手法を提案した.
- 格闘ゲームはリアルタイム制のビデオゲームで,最適な戦略が相手の戦略に応じて変化するのが難しい点である.既存研究・既存技術ではさまざまなアプローチがみられるが,いわゆるルールベース型のAIは性能が高いが適応性に欠け,オンライン学習型のAIには適応性はあるが性能に欠けがちな傾向があった.本研究はルールベース型のAIを複数組み合わせ,相手の戦略に対しAIを適応的に切り替えることで,両手法の長所を合わせた手法を提案した.
- シューティングは日本で人気の高いゲームジャンルで,画面上の敵の撃ってくる弾を避けながら敵を撃墜してステージのクリアを目指す.このジャンルを扱った既存研究は少なく,本研究によって新たにMiniMax型の木探索で「人間らしい動き」のAIを設計して被験者実験によりその動きの自然さを評価した.
この4つの対象ゲームはどれも有名なジャンルであり,売り上げや普及の規模を見ても取り組む意義が高い.これらの対象ゲームに本研究はαβ探索やモンテカルロ法など,なるべく原理が単純な手法を選んで適用した.

(2018年5月7日受付)