6R-01
強化学習におけるスパースコーディングを用いた効率的な転移学習
○齋藤 碧,小林一郎(お茶の水女子大)
転移学習において、強化学習で得られた知識を転移し新しい環境にも適用することで、最初から学習しなおすよりも学習を効率化することができる。
しかし、強化学習の転移学習において、それらの蓄積された知識をどの程度の割合で転移するかを決定するのは難しい。
そこで本研究では、スパースコーディングを転移学習に適用することで知識の選択及び、その程度を明確にすることを可能にした新しい手法を提案する。
コスト付き迷路における目的地までの経路を発見する課題の実験において、提案手法が従来のQ学習と比べて、新しい環境で良好な初期探索の実現と探索総コストの削減に大いに貢献した。

footer 情報処理学会 セキュリティ プライバシーポリシー 倫理綱領 著作権について