5M-06
畳み込みニューラルネットワークを用いた過去の履歴を考慮した強化学習
○新妻 純,長名優子(東京工科大)
Deep Learning とQ Learningを組み合わせた手法を用いて学習を行
うDeep Q-Networkが提案されている。Deep Q-Network は複数のアー
ケードゲームに対してそれぞれのゲームのための調整をせずに適用
され、ゲームによっては人間よりも高いスコアを獲得している。し
かし、4 時刻分の画面のデータを入力としているので、過去の履歴
を考慮して行動を決定しなければならないゲームは苦手であるとい
う問題がある。本研究では、Deep Q-Networkへの入力として過去の
履歴も含めたパターンを利用することにより、過去の履歴などを考
慮する方法について検討を行う。

footer 著作権について 倫理綱領 プライバシーポリシー セキュリティ 情報処理学会