1S-06
BERTによる参考文献書誌情報抽出精度の向上
膨大な文書が格納されている電子図書館の運用には、書誌情報データベースの整備が必須である.特に学術論文の参考文献欄には著者名やタイトルなどの有用な書誌情報が集約されているため,参考文献文字列から書誌情報を自動抽出する研究が行われている。浪越らは,参考文献書誌情報抽出において,Bi-directional LSTM-CNN-CRFを利用し,参考文献文字列からトークンとその書誌要素を同時に推定した.本稿では,自然言語処理のあらゆるタスクでSOTAを達成している言語モデル,BERTを用いて,書誌情報抽出精度を向上させる方法を提案し,実験により評価する.