情報処理学会 第88回全国大会

1U-06
AIモデル説明Grad-CAMに対する敵対的攻撃の提案と評価
○寳木隆正,菊池浩明(明大)
深層学習モデルの判断根拠を可視化するモデル説明手法として Grad-CAM が広く用いられている.しかし,Grad-CAM のヒートマップによるモデル説明の正しさや意図的に加工した入力によってデル説明が誤る可能性があると考える.そこで,本研究では,敵対的攻撃Fast Gradient Sign Method (FGSM)を元に,画像識別モデルResNet50に対するGrad-CAMのモデル説明を狂わせる方式を提案する.予測順位を入れ替える損失関数を用いて摂動を加え,Grad-CAMのモデル説明結果,ResNet50の誤分類,そして,人間が評価したモデル説明の差を評価する.