抄録
CH-005
紙面の色と見開きの歪みを考慮した光学文字認識の実装と評価
比留川翔哉・丸山一貴(明星大)
近年,様々な光学文字認識サービスが利用できるが,歪み補正や,平滑化などの適切な補正が行われず精度低下の原因になる.本研究は,書籍の様々な文字に近似した文字画像を生成し,畳み込みニューラルネットワークを用いて文字認識を行う.学習データは,文字色・背景色とフォント,解像度を12通り作成する.その後,各学習データの精度を算出し,歪んだ文字の認識に必要な要件を考察し評価する.提案手法の精度は,既存手法より精度が高い書籍と低い書籍に分かれる結果となった.今後は,学習画像を生成する要件を最適化し,生成画像のバリエーションを増やすことで精度向上につなげる.