2S-2
時系列パターンのためのニューロンの追加が可能な領域表現を用いた高速KFM連想メモリを用いた強化学習による探索行動の学習
○天野淳平,長名優子(東京工科大)
ニューラルネットワークを用いた強化学習において、エルマンネットを用いた強化学習による探索行動の学習が提案されている。この研究では、エルマンネットの導入により、ゴールまでの道のりが短い場合であれば、ある程度正しく現在の状態を評価し、それを利用した効率的な探索が行えていることが示されている。しかし、この方法では繰り返しを含む時系列をうまく学習できない場合があり、ゴールまでの道のりが長いタスクの学習が困難であることも分かっている。本研究では時系列パターンの逐次的な学習を行うことができ、再帰差分ベクトルを用いることで過去の影響を考慮した想起が行える時系列パターンのためのニューロンの追加が可能な領域表現を用いた高速KFM(Kohonen Feature Map)連想メモリを用いた強化学習を提案し、ゴールまでの道のりが長いタスクにおける学習を実現する。

footer 情報処理学会 セキュリティ プライバシーポリシー 倫理綱領 著作権について