情報処理学会 第86回全国大会 会期:2024年3月15日~17日

7ZK-05
日本近代公文書画像における文脈を考慮した文字検出手法
○宮川裕貴,山田雅之,中 貴俊,兼松篤子,宮崎慎也,長谷川純一(中京大)
近代の公文書には史料的価値があるが,その多くはくずし字を含む手書きの文書であるため近代古文書の知識が無ければ解読が困難である.我々は台湾総督府文書を題材として,近代公文書を対象としたOCRシステムの開発を進めている.本研究では文字検出を行う機械学習モデルとして,画像特徴と文脈情報を利用するTransformerベースのモデルを提案する.このモデルはエンコーダでは画像特徴の抽出を行い,デコーダでは画像特徴と文脈情報を合わせて文字検出のための特徴を獲得,これを利用して画像中の各文字の領域と字種を予測する.近代公文書画像に対して文脈を考慮しないモデルとの精度比較を通じて提案モデルの有効性を示す.