4ZK-03
アミノ酸配列のグラフ表示画像を用いた機械学習によるタンパク質ファミリー分類
○水野泰旭,水田智史(弘前大)
タンパク質をファミリーに分類することは、タンパク質の機能を知るため
の手掛かりを得る上で大変重要である。ファミリーは祖先が共通のタンパク質
のグループであり、そのメンバーは互いに類似したアミノ酸配列を持ち、その
機能も類似している。本研究では、機械学習によりタンパク質をファミリーに
分類する分類器を構築することを目的とする。機械学習には、各アミノ酸に3
個のアミノ酸指標を使用したベクトルを割り当て、配列を3次元グラフ化した
後、それを各平面に正射影して得られる2次元画像を学習データとして用いる。
ベンチマークテストとしてGPCRの5クラス分類を行う。