情報処理学会第78回全国大会講演論文集

3C-04

深層強化学習ための環境シミュレーションと自律制御ロボットの連携

○宮島優太郎，李　天琦，田胡和哉，柴田千尋（東京工科大）

近年、深層強化学習とよばれる手法により、従来と比較して容易に、ロボットの行動が視覚情報から学習できるようになってきている。それらの手法では、従来の強化学習の手法であるQ学習で用いられる行動状態価値を、深層学習の技術を用いて一連の画像情報から学習させる。本研究では、深層強化学習を行うためのシミュレータを構築し、シミュレータ上の環境を実際の環境にある程度一致させることで、自律制御ロボットの行動学習を行わせる。深層強化学習の手法は、一部のゲームなどでは人間のエキスパートを上回るスコアを達成できることが確認されているが、本稿では、リアルな環境で動くロボットに対して、環境のシミュレーションを通してどの程度適応させることができるかについて論じる。

情報処理学会 第78回全国大会講演要旨

情報処理学会第78回全国大会講演要旨