情報処理学会 第87回全国大会

7X-04
絵本におけるルビを活用した文字認識
○鈴木結理,寺沢憲吾(はこだて未来大)
絵本は,様々な要因により市販の文字認識システムでは文字認識精度が低い.また,絵本の特徴として,総ルビの絵本が多い点や,ルビがひらがなかカタカナである点が挙げられる.そこで,本研究ではルビに着目する.ルビの情報を活用した文字認識システムを提案することで,絵本の文字認識精度を向上させる.提案手法では,まず,CRAFTを使用して単文字を検出する.次に,各文字に対して単文字認識を行う.その後,読み順を推定しテキスト化する.読み順を推定する際にルビを活用することで,漢字の誤認識を修正する.提案手法の評価は,提案手法と同じくCRAFTを文字検出に使用している文字認識システムであるeasyOCRと比較する.