5T-09
文字認識モデル訓練のためのスタイル変換を用いた手書き文字生成
○北川智樹,チーシャン レオ,矢島英明,西崎博光(山梨大)
深層学習を用いた文字認識システムでは、高性能な文字認識器を学習させるために、大量のデータが必要であることはよく知られている。本稿では、Adaptive Instance Normalization(AdaIN)のスタイル変換モデルに学習済みのConnecting text and images(CLIP)のText Encoderを導入し、漢字を含む日本語文字を生成することで、手書き文字認識器の学習用データ量を増やす。実験の結果、提案するスタイル変換モデルは日本語の文字画像を生成でき、手書き文字認識器の学習に用いることができ、手書き文字認識精度(F1スコア)を向上することがわかった。