6ZM-01
画像特徴量のロバスト性に着目した教師なし敵対的サンプル検知
○神田悠斗,波多野賢治(同志社大)
敵対的サンプルとは,機械学習モデルが誤分類を引き起こすよう巧妙に細工された入力データである.そのような入力を含むデータ群に対して誤分類を防ぐためには,敵対的サンプルを検知する必要がある.近年の研究では,機械学習モデルが予測の根拠としている特徴量のロバスト性に着目し,特にロバスト性の低い特徴量の存在が敵対的サンプルを生み出す主要な原因であると主張している.この仮説に従い,本研究では入力画像特徴量のロバスト性に着目した敵対的サンプル検知手法を提案する.具体的には,入力画像に対してノイズを付与することで特徴量のロバスト性を計測し,正常な画像と敵対的サンプルとの差異を敵対的サンプルの検知に利用する.