2T-02
自己組織化特徴マップに基づいた時系列パターンのための確率的連想メモリによる強化学習の実現
○新妻 純,長名優子(東京工科大)
本研究では、自己組織化特徴マップに基づいた時系列パターンのための確率的連想メモリを提案し、それを用いてPOMDPs環境のための決定的政策を学習するProfit Sharingを実現する。自己組織化特徴マップに基づいた時系列パターンのための確率的連想メモリでは、時系列パターンを逐次的に学習することができる。学習において、パターンを一つのニューロンに対応させることで記憶させるが、信頼度をパターンごとに設定することが可能となっており、共通項に対応する複数の時系列パターンを信頼度に応じた比率で想起することができる。さらに、未学習のパターンが入力された場合に、ニューロンの追加を行い、学習を行うことができる。

footer 情報処理学会 セキュリティ プライバシーポリシー 倫理綱領 著作権について