情報処理学会 第87回全国大会

2D-02
深層学習による麻雀の待ち牌予測
○肱岡拓実,上野敦志(大阪公立大)
麻雀などの不完全情報ゲームにおいて、公開されている限られた情報を利用して他人の行動や勝率などを推測することは、どの程度リスクを取るかなど戦略上で非常に重要である。本研究では麻雀において戦略上重要な、他家の待ち牌の予測を確率として出力するモデルを構築する。NNやTransformerエンコーダを用いて、副露や打牌といった他家の行動を時系列データとして扱い、場況など非時系列データと合わせて教師あり学習を行う。訓練データにはオンライン麻雀サイト「天鳳」の上級プレイヤが試合する卓の牌譜より、誰かが和了する直前の局面を使用する。時系列データやその他データがどの程度予測に寄与するかも含め、モデルの評価実験を行った。