情報処理学会 第87回全国大会

6B-05
化学分野文献からの情報抽出におけるテキスト長を考慮したTable-Fillingモデル
○中岡宏徳(住友金属鉱山),乾 孝司(筑波大)
研究開発において論文や特許調査は必要不可欠であるが、調査対象である文献は膨大で、調査に時間がかかる上に網羅的な情報把握は困難である。自然言語処理はこの問題を解決する有用な手段である。
本研究ではBERTをベースとしたTable-Fillingモデルにより化学分野文献から化合物の合成方法を抽出した。Table-Fillingモデルは固有表現抽出と関係抽出を同じテキスト長に対して行うが、固有表現抽出はテキスト長が長い方が適しており、関係抽出はテキスト長が短い方が適している。本研究ではテキスト長を考慮したTable-Fillingモデルにより高い精度で化合物の合成方法を抽出することを可能にした。