(邦訳:プロファイルと履歴を組織間で統合利用するプライバシ保護推薦システム)
山口 高康 (株)NTTドコモ 先進技術研究所 主任研究員 |
キーワード
プライバシ保護 | 推薦システム | 差分プライバシ |
[背景]各種データを使う推薦ができるのはそれらを保有する大組織に限られる
[問題]大組織による寡占,中小組織の凋落,ユーザのプライバシへの侵害
[貢献]複数の組織が連携してプライバシを守りつつ推薦できるシステムを実現
[貢献]複数の組織が連携してプライバシを守りつつ推薦できるシステムを実現
近年,商品やサービスを提供する組織が,データを活用してユーザが好む商品をいち早く推薦することで,大きく売り上げを伸ばしている.推薦の元となるデータには,ユーザの性別や年代などのプロファイルといったヒトに関するデータや,日々購入される商品の履歴といったモノに関するデータがある.プロファイルがあれば,多くの飲料の中から20代の女性にはクリームソーダ,30代の男性には珈琲といったように,好まれそうな商品を推薦できる.また,履歴があれば,一緒に購入されやすい商品を統計で把握しておき,オムツが買い物カゴへ入れられたら「赤ちゃんを眺めながら家族団らんを楽しむのにビールはいかがですか?」といった推薦ができる.ユーザが求める商品を的確に当てる推薦は,商店だけでなくユーザにとっても役に立つ.プロファイルと履歴の両方を用いれば,履歴が少ない珍しい商品や新商品についてもプロファイルを手掛かりにして推薦できるため,推薦精度を向上できる.しかし,プロファイルと履歴の両方を大量に保有している大組織は発展するが,少量の履歴しか持たない中小組織は衰退してしまう.プロファイルは個人情報なので,中小組織がプロファイルを扱うには,法令遵守やプライバシ保護の負担が大きい.中小組織が衰退すれば,ユーザが購入できる組織や商品の選択肢が狭くなる.特定の大組織に依存しなければ生活できない世の中になってしまったら,その大組織の思い通りに商品の価格を決められてしまう可能性もある.さらに,大組織がプロファイルと履歴をすべて保有することから,ユーザのプライバシが侵害されるかもしれない.
本研究では,プロファイルを保有している事業者をID管理組織として導入し,ID管理組織と商店とユーザの3者を連携させて推薦を行うことにする.この推薦システムは,ID管理組織のプロファイルと商店の履歴を統合して,どのプロファイルの人にどの商品が売れているのかという統計を算出しておき,ユーザが商店を訪問した時点で,ユーザのプロファイルに応じて好まれそうな商品を推薦する.日頃からプロファイルの収集と管理を行っているクレジットカード会社や携帯電話会社などをID管理組織とすることで,中小組織である商店の負担を減らすことができる.しかし,このままでは3者間で互いに情報が漏れてプライバシが漏洩してしまう.そこで,ID管理組織と商店とユーザのやりとりから情報漏洩を防止する暗号化,商店が手に入れた統計やユーザが手に入れた推薦結果から情報漏洩を防止する匿名化,匿名化によって歪められた統計を補正して精度を高める高精度化の3つの技術をうまく連携させて,3者のプライバシを守りながら,推薦できるようにした.匿名化では,差分プライバシという考え方に基づいて,新しい方法を提案し,高精度化では,スムージングという考え方に基づいて,複数の組織が協調して利用できる新しい方法を提案した.1,000万人のユーザに1,000種類の商品を推薦する場合に,事前に統計を算出しておく準備処理を14日で達成し,ユーザが商店を訪問したときに商品を推薦する処理を1秒以内で達成できた.
本研究では,プロファイルを保有している事業者をID管理組織として導入し,ID管理組織と商店とユーザの3者を連携させて推薦を行うことにする.この推薦システムは,ID管理組織のプロファイルと商店の履歴を統合して,どのプロファイルの人にどの商品が売れているのかという統計を算出しておき,ユーザが商店を訪問した時点で,ユーザのプロファイルに応じて好まれそうな商品を推薦する.日頃からプロファイルの収集と管理を行っているクレジットカード会社や携帯電話会社などをID管理組織とすることで,中小組織である商店の負担を減らすことができる.しかし,このままでは3者間で互いに情報が漏れてプライバシが漏洩してしまう.そこで,ID管理組織と商店とユーザのやりとりから情報漏洩を防止する暗号化,商店が手に入れた統計やユーザが手に入れた推薦結果から情報漏洩を防止する匿名化,匿名化によって歪められた統計を補正して精度を高める高精度化の3つの技術をうまく連携させて,3者のプライバシを守りながら,推薦できるようにした.匿名化では,差分プライバシという考え方に基づいて,新しい方法を提案し,高精度化では,スムージングという考え方に基づいて,複数の組織が協調して利用できる新しい方法を提案した.1,000万人のユーザに1,000種類の商品を推薦する場合に,事前に統計を算出しておく準備処理を14日で達成し,ユーザが商店を訪問したときに商品を推薦する処理を1秒以内で達成できた.
課題(組織が保有するデータの違いから生じる不公平)
解決策(プロファイルと履歴を組織間で統合利用するプライバシ保護推薦)
(2019年5月21日受付)