情報処理学会 第86回全国大会 会期:2024年3月15日~17日

6ZC-01
微小な再攻撃による敵対的事例の矯正に関する基礎検討
○森本文哉,小野智司(鹿児島大)
深層ニューラルネットワークには,入力に対して人間に知覚できない特殊な摂動が加えられた敵対的サンプル(Adversarial Examples:AE)を誤認識してしまう脆弱性が存在する.この脆弱性はセキュリティが重要なタスクにおいて深刻な問題であり,AEに対する防御手法が研究されている.既存の研究では,検出器により検出されたAEの分類結果を矯正する手法があるが,2段階の処理が必要となる.本研究では,AEと正常な入力の区別なく,正しい分類結果を出力する手法を提案する.本手法は,極めて微小な摂動を設計することで,正常な入力に対しては分類結果を維持し,AEの分類結果のみを矯正することが可能である.