FIT2018 第17回情報科学技術フォーラム

電子情報通信学会情報・システムソサイエティ
電子情報通信学会ヒューマンコミュニケーショングループ
情報処理学会

抄録

F-042
可視化によるDeep Q Networkの行動価値根拠の分析

◎長嶺一輝・遠藤聡志・山田孝治・當間愛晃・赤嶺有平（琉球大）

人間がビデオゲームといったタスクを解くとき、そのタスクに出現するオブジェクトやその位置関係などの視覚的特徴に注視する。画像ベースのゲームタスクにおいて人間並みのパフォーマンスを発揮する、Deep Q Network という深層強化学習アルゴリズムでも同様な事象が起きていると推測できる。そこで、本研究では、DQNが行動価値を計算する際に用いる CNN を Grad-CAM という手法で可視化して、学習過程でどのような特徴を捉えているか分析することを目的とする。