6ZK-03
CRAFT と CNN を用いた二段階手法による日本語手書き文書画像の文字認識
○中野遥斗,寺沢憲吾(はこだて未来大)
日本には未翻刻の手書き文書が多数現存し,手作業で翻刻されることが多い.手書き文書には書き手の癖や経年劣化などで,判読が困難である文字が多く含まれ,手作業で翻刻することは大きな負担となる.未翻刻の手書き文書に対して,機械学習など IT 技術を活用した精度の高い文字認識が実現できれば,自動化が進み,翻刻者の負担の軽減が期待される.そこで本研究では,未翻刻の手書き文書である「台湾総督府文書」もしくは「波照間方言語彙」を対象に,ディープラーニングを用いた単文字認識を行う.認識精度向上に向けた様々な手法や,単文字切り出しに CRAFT を活用することで,End-to-End なシステムの実装を目指す.