6P-04
ニューラルネットワークを用いた麻雀の待ち牌予測
○佐藤宏樹(芝浦工大)
麻雀のように手札や山札などの対戦相手の情報が隠されている不完全情報ゲームでは, 安定して勝つことが難しいとされている.
本研究の目的は, 麻雀においてできる限り失点しないために, 他プレイヤの待ち牌予測法を提案することである.
待ち牌予測モデルの構築には機械学習の手法の1つであるニューラルネットワークを用いた教師あり学習を行う.
その訓練データには, オンライン麻雀対戦サイト天鳳のトッププレイヤ同士の牌譜を用いる.
モデルは誰かが最初に立直をした時点での局面から待ち牌を予測する.
その際, 捨牌の順序は考慮しない.
複雑な待ち牌を除外した場合や待ちの形を考慮した場合も含めて, モデルの評価実験を行なった.