3P-03
人間プレイヤーに対する近似ナッシュ均衡戦略の有効性
○谷口慶一郎,伊藤孝行(名工大)
不完全情報ゲームの近似ナッシュ均衡を求めるための手法として,Counterfactual Regret Minimization(CFR)が提案されている.CFRはself-playによって近似ナッシュ均衡を探索するアルゴリズムであるが,対戦相手の特性や効用を考慮したアルゴリズムではない.特に人間は,個人によって性格や価値観が大きく変わるため,CFRから導いた戦略が有効でない場合がある.
そこで本研究では,不完全情報ゲームとしてポーカーのルールのひとつである2 player Limit Texas Hold’emを用いて,self-playから導いた近似ナッシュ均衡が,人間に対してどの程度有効かを実験により検証する.

footer 情報処理学会 セキュリティ プライバシーポリシー 倫理綱領 著作権について