情報処理学会 第88回全国大会

7ZD-06
人間参加型強化学習における休眠率を用いたフィードバック制御
○中野雄貴,田口 亮(名工大)
従来のロボット強化学習には,報酬設計の困難さや学習過程がブラックボックス化しやすいという課題がある.これに対し,学習中に人間がフィードバック等によって介入する人間参加型強化学習が注目されている.しかし,この手法ではフィードバックを与える最適なタイミングが不明確であったり,人的なノイズが学習を阻害したりする場合がある.そこで本研究では,ニューラルネットワークにおけるニューロンの休眠率に着目し,これを介入のトリガーとすることで,適切なタイミングと頻度で効率的なフィードバックを行う手法を提案する.