情報処理学会第88回全国大会

OCRを用いた古文書の解読では、誤認識の多さが課題となっている。特に、古文書の字体がくずし字であり、資料の経年劣化や書き手の癖による、現代の文書にはない特徴が主要な理由である。そこで、本研究では、OCRが確信度が低いと判定した文字に対して複数の文字候補を提示し、大規模言語モデル(LLM)を用いて最適な文脈に補正する手法を一連の流れとして体系化する。これにより、くずし字認識の精度を向上させ、従来は人手で補完されていたOCRの誤認識箇所の解読を自動化し、古文書の翻刻の作業効率向上を目指す。