7A-02
カープローブの大規模シンセティックデータの生成と共有
○水野貴之(NII),藤本祥二,石川 温(金沢学院大)
人々の位置情報履歴(連続的に記録された位置情報)は個人情報に該当するたに,「災害対策,テロ対策,公衆衛生,地域差別,マーケティング,混雑対策」に重要だけれども,研究者が容易にアクセスできる十分に存在しない.この問題を解決する1つの手段が,本物そっくりのシンセティック(フェイク)移動軌跡データを人工知能で生成して公開することである.本研究では,大規模言語モデルGPTアーキテクチャを利用して,日本全国を網羅するカープローブの大規模シンセティックデータを作成し,公開する.位置情報を空間的な絶対座標と相対座標を表す文字情報に変換することで,許諾の取れたカープローブのデータをGPTアーキテクチャで学習することができる.学習後のモデルが生成する移動軌跡は,本物のカープローブと同じ特徴を示す.