情報処理学会第79回全国大会講演論文集

5M-06

畳み込みニューラルネットワークを用いた過去の履歴を考慮した強化学習

○新妻　純，長名優子（東京工科大）

Deep Learning とQ Learningを組み合わせた手法を用いて学習を行
うDeep Q-Networkが提案されている。Deep Q-Network は複数のアー
ケードゲームに対してそれぞれのゲームのための調整をせずに適用
され、ゲームによっては人間よりも高いスコアを獲得している。し
かし、4 時刻分の画面のデータを入力としているので、過去の履歴
を考慮して行動を決定しなければならないゲームは苦手であるとい
う問題がある。本研究では、Deep Q-Networkへの入力として過去の
履歴も含めたパターンを利用することにより、過去の履歴などを考
慮する方法について検討を行う。

情報処理学会 第79回全国大会講演要旨

情報処理学会第79回全国大会講演要旨