情報処理学会 第82回全国大会 会期:2020年3月5日~7日 会場:金沢工業大学 扇が丘キャンパス 情報処理学会 第82回全国大会 会期:2020年3月5日~7日 会場:金沢工業大学 扇が丘キャンパス

4U-08
Deep Belief Networkを用いたQ Learningの実現 - プレイデータを用いた事前学習の影響の検討 -
○片井遼太,長名優子(東京工科大)
Deep Belief Network を用いて Q Learningを実現する手法が提案
されている。Deep Belief Networkは畳み込みニューラルネットワ
ークに比べて少ないデータで学習が行える可能性があるが、これ
までの研究では、この手法を用いてゲームを題材として学習を行え
る可能性があることが示されてはいるが、 Deep Q-Networkに比べ
高いスコアを得ることができていない。この原因として、下位層
の事前学習を行う際に、十分な試行錯誤が行えておらず、観測のご
く一部のみしか考慮できていない可能性があると考えられる。本研
究では、 Deep Belief Networkを用いた Q Learningにおいて、事
前学習に用いるデータに関する検討を行う。