5ZL-01
不均衡データによる生物種分類における相補鎖を考慮した水増しとベクトル割当の見直しによる精度向上
○中西提己,水田智史(弘前大)
生物種間の系統解析ではアライメントによる手法が広く用いられているが、大規模な配列では大きな計算コストが問題となる。そのため、アライメントに依らない方法として、塩基配列の各塩基にベクトルを割り当てグラフ表示した画像を利用する方法がある。この方法を用いた機械学習による生物種分類では、データの不均衡により分類精度が低くなるという問題がある。本研究では、データセット内に相補鎖のデータが含まれていることに着目し、それを考慮したデータの水増しによりデータ不均衡へ対処するとともに、3通りのベクトル割当を比較し、単体モデルおよび複数のグラフ化画像を用いたモデルで精度向上を検証した。