情報処理学会 第87回全国大会

6N-07
LLMを用いた三次元電子線回折データの分類に関する一検討
○安田和幸,深澤祐輔,熊谷政仁,佐藤雅之,小松一彦,小林広明(東北大)
近年、材料科学や創薬などの様々な分野において、分子の化学的性質を理解するために、分子構造解析が重要な役割を担っている。分子構造解析の代表的な手法の一つである電子線三次元結晶構造解析法では、単一の分子に対して数百から千以上の分子構造データが生成される。これらのデータには不正確なものが数多く含まれており、研究者が一つ一つ選別する必要があるため、大きな負担となっている。本研究では、既存の言語表現手法であるSMILESを応用して分子構造を言語表現し、大規模言語モデルに分子構造の正誤を学習させることによって、分子構造データの分類を行う。