情報処理学会 第86回全国大会 会期:2024年3月15日~17日

5ZJ-06
機械学習を用いたゲノム多型データによる日本人の出身都道府県の予測
○松永一真(東海大),野川 駿,齋藤憲司(ジーンクエスト),今西 規(東海大)
われわれは機械学習を用いて、ゲノム多型データによる日本人の出身都道府県の予測を行った。SNPアレイを用いてタイピングされた約21万6千ヶ所のSNPsデータの対立遺伝子頻度から、各都道府県のジェノタイプ頻度をそれぞれ計算した。ジェノタイプ頻度を基に各都道府県の遺伝子型シミュレーションデータを作成し、これと実際の日本人のゲノム多型データを機械学習にかけた。Pythonの機械学習ライブラリであるscikit-learnを用いて複数のモデルで検証し、出身都道府県の予測精度について考察した。その結果、以前に作成したベイズ推定よりも高い正解率を達成することができた。