情報処理学会第85回全国大会 会期:2023年3月2日~4日 会場:電気通信大学

1ZD-06
匿名化された健康診断と診療履歴の時系列データによる糖尿病罹患予測
○清水正浩,石山晴斗,菊池浩明(明大)
近年,機械学習や AI 技術の発展により, ビックデータの利活用が多様な場面で盛んになっている. 中でも, 健康診断データは病気の罹患を予測する有効な情報と考えられる.長期間の健康診断や診療履歴が匿名化されて提供され,対象集団の病気の罹患を高精度で予測し,診断データの変化を追跡することが可能になってきた.
 そこで, 本稿では, あるヘルスケア企業が取得し,匿名加工情報とした約 230 万人分の健康診断と診療履歴データを使用し,糖尿病罹患者の各特徴量の時系列変化を調査する. 時系列変化を特徴量として,複数の機械学習アルゴリズムを用いて, 3年以内に糖尿病に罹患する確率を予測するモデルを提案し, その精度を分析する.