抄録
F-042
可視化によるDeep Q Networkの行動価値根拠の分析
長嶺一輝・遠藤聡志・山田孝治・當間愛晃・赤嶺有平(琉球大)
人間がビデオゲームといったタスクを解くとき、そのタスクに出現するオブジェクトやその位置関係などの視覚的特徴に注視する。画像ベースのゲームタスクにおいて人間並みのパフォーマンスを発揮する、Deep Q Network という深層強化学習アルゴリズムでも同様な事象が起きていると推測できる。そこで、本研究では、DQNが行動価値を計算する際に用いる CNN を Grad-CAM という手法で可視化して、学習過程でどのような特徴を捉えているか分析することを目的とする。