情報処理学会 第86回全国大会 会期:2024年3月15日~17日

6ZM-04
ポテンシャル法と強化学習を用いたサンプル効率改善に関する検討
○榎本隆士,栁澤一機(日大)
近年,人工知能の知識を持った技術者の育成が重要となっている.人工知能技術の1つである強化学習は,学習環境を用意することで自ら学習を行うが,学習に膨大な時間を必要とするため強化学習をテーマとした教材では学習から結果の確認までに時間がかかる.本研究では強化学習のサンプル効率の改善を目的とし,強化学習の1手法であるQ学習を用いて鬼ごっこをテーマとしたシミュレーション環境を作成した.障害物と目的地に関数を定義してそれの勾配にそった経路で目的地までの経路を出すポテンシャル法とQ学習を組み合わせ,探索にポテンシャル法を用いることでサンプル効率が改善されているかの検討を行った.