4S-06
認知的満足化アルゴリズムの木探索への応用
○齋藤建志,高橋達二(電機大)
知識を自ら選択、獲得しながらうまく振る舞えるような人工知能の需要は大きい。このような枠組みは強化学習と呼ばれ、モデル化によって状態遷移を木で表現できることがある。そのような場合、状態遷移を繰り返すごとに木は深く大きくなっていき、探索空間が膨大になりやすい。そのため、人工知能による木探索ではUCBという価値関数を用いたモンテカルロ木探索が多く利用されてきた。しかし、膨大な試行回数が必要であったり、初期の振る舞いによる指標誤差の問題があった。
 そこで、本研究では人間の意思決定法における特性の満足化を価値関数に取り入れた木探索に有用なアルゴリズムを提案し、シミュレーションによる評価を行う。

footer 著作権について 倫理綱領 プライバシーポリシー セキュリティ 情報処理学会