情報処理学会第80回全国大会講演論文集

6M-07

ニューラルネットワークを用いた強化学習における環境状態の分布を考慮した擬似リハーサルの導入

○辺見航平，服部元信（山梨大）

近年,ニューラルネットワーク(NN)を用いた強化学習が強化学習研究の主流となっている.中でもDirect-Vision-Based強化学習やNeural Fitted Q network,深層NNを用いたDeep Q Networkなどの手法の登場により,強化学習の性能向上が確認されている.しかし,強化学習はその試行錯誤的な学習方法から,最適な方策を獲得するまでに多くの学習回数を要する.それに加えNN特有の問題が存在し,学習効率の悪化が起こっていると考えられている.この問題を解決するためにMarochkoらは擬似リハーサルと呼ばれる手法を強化学習に導入してその有効性を示した.本研究では学習効率の更なる向上を期待し,擬似リハーサルにおける擬似入力生成方法の改良を行い,計算機実験によってその有効性を検証した.

情報処理学会 第80回全国大会講演要旨

情報処理学会第80回全国大会講演要旨