情報処理学会 第86回全国大会 会期:2024年3月15日~17日

4ZD-01
混合型データセットに対するkm-匿名化手法
○金澤理乃,小林雅弥,藤岡 淳(神奈川大),千田浩司(群馬大),永井 彰,安田 幹(NTT社会情報研究所)
人工知能やデータマイニングの研究・開発が進むにつれ,ビッグデータの需要は高まってきている.その活用には個人の特定を防ぐためにk-匿名化のような処理が必要不可欠である.
しかし,高次元データをk-匿名化することは困難であるので,制約を強めたkm-匿名性が提案され,Poulisらはkm-匿名化手法を提案したが,一般化による手法であったため2値行列データにおいて使用できなかった.
一方,小林らは2値行列データにおいて一般化を用いない手法を提案したが,多値データが混在した場合には使用できないことが問題である.
そのため本稿では,2値と多値の両方が混在する行列データに対するkm-匿名化手法を提案し,その有用性を検証する.