6M-07
ニューラルネットワークを用いた強化学習における環境状態の分布を考慮した擬似リハーサルの導入
○辺見航平,服部元信(山梨大)
近年,ニューラルネットワーク(NN)を用いた強化学習が強化学習研究の主流となっている.中でもDirect-Vision-Based強化学習やNeural Fitted Q network,深層NNを用いたDeep Q Networkなどの手法の登場により,強化学習の性能向上が確認されている.しかし,強化学習はその試行錯誤的な学習方法から,最適な方策を獲得するまでに多くの学習回数を要する.それに加えNN特有の問題が存在し,学習効率の悪化が起こっていると考えられている.この問題を解決するためにMarochkoらは擬似リハーサルと呼ばれる手法を強化学習に導入してその有効性を示した.本研究では学習効率の更なる向上を期待し,擬似リハーサルにおける擬似入力生成方法の改良を行い,計算機実験によってその有効性を検証した.

footer 著作権について 倫理綱領 プライバシーポリシー セキュリティ 情報処理学会