FIT2019 第18回情報科学技術フォーラム

抄録

F-003
GANを用いたモデルベースな深層強化学習に関する考察

◎丸山元輝・遠藤聡志・山田孝治・當間愛晃・赤嶺有平（琉球大）

深層強化学習の主流であるモデルフリーの学習では、経験則のみを用いて学習を行うことができるが、膨大な経験を必要とし学習に時間がかかる。そこで、モデルベースな手法を用いることで、効率的な学習を行うことが試みられている。Azizzadenesheliらの先行研究ではDQNを使用したモデルベースな手法を実装する際に、次の状態を予測することができるように学習したGANと、報酬を推定するモデルを組み合わせて先読みとDyna-Qアルゴリズムを用いた。しかしながら、GANの予測と報酬推定が実現できている反面、DQNの学習がうまく進まない。そこで、先行研究に関する改善の実験による考察検討を行う。

A	モデル・アルゴリズム・プログラミング
B	ソフトウェア
C	ハードウェア・アーキテクチャ
D	データベース
E	自然言語・音声・音楽
F	人工知能・ゲーム
G	生体情報科学
H	画像認識・メディア理解
I	グラフィクス・画像
J	ヒューマンコミュニケーション＆インタラクション
K	教育工学・福祉工学・マルチメディア応用
L	ネットワーク・セキュリティ
M	ユビキタス・モバイルコンピューティング
N	教育・人文科学
O	情報システム