情報処理学会 第87回全国大会

2ZD-01
差分プライバシーを悪用したモデルポイズニング攻撃に対するゼロ知識証明による防御プロトコルの設計
○大倉優輝,内田真人(早大)
差分プライバシーを導入した連合学習(DPFL)は、強力なデータプライバシーを提供する一方で、差分プライバシーのノイズを操作したポイズニング攻撃に脆弱であることが知られている。特に、DeSMP攻撃は、ローカルパラメータに付与されるノイズに意図的なバイアスを隠蔽することで、学習モデルの性能を劣化させる。この攻撃に対し、統計的な手法で防御を試みても、ノイズの確率的な変動により攻撃パラメータと正常パラメータを識別することは困難である。こうした統計的防御の限界に対し、本研究では、差分プライバシーの適用プロセスをゼロ知識証明で検証することで、攻撃者によるノイズの操作自体を防止する防御プロトコルを提案する。