2U-5
スパースコーディングを用いた強化学習における転移学習の一考察
○齋藤 碧,小林一郎(お茶の水女子大)
エージェントの方策を学習するのに強化学習が一般に用いられている。強化学習
は対象となるタスクに関する行動知識がない場合はランダムに探索することによ
り方策を得なければならず、学習効率が悪い。そのため、類似したタスクから得
た知識を適用する転移学習が広く採用されている。転移学習においてソースのタ
スクとなる大量のデータから、その本質的な情報だけを効率よく転移するのにス
パースコーディングを用いた手法が提案されている。本研究では、転移学習にお
けるスパースコーディングの適用について考察を行う。

footer 情報処理学会 セキュリティ プライバシーポリシー 倫理綱領 著作権について