情報処理学会 第87回全国大会

1ZD-06
日本語特有の表記体系を利用した再攻撃による敵対的防御の基礎検討
○秋本一樹,森本文哉,小野智司(鹿児島大)
深層ニューラルネットワーク(Deep Neural Network: DNN)には,微小な変更が加えられた入力である敵対的事例を誤認識してしまう脆弱性が存在する.この脆弱性により,例えば,DNNモデルがサイト上の悪質な書き込みや誹謗中傷を適切に排除できなくなる問題が懸念されるため,敵対的事例に対する頑健性向上を目的とした防御手法が研究されている.日本語処理用のDNNモデルにも同様の脆弱性が存在するが,日本語に特化した敵対的防御に関する研究は行われていない.本研究では,日本語自然言語処理モデルの頑健性を向上することを目的とした,日本語特有の表記体系を利用した再攻撃による敵対的防御手法を提案する.