情報処理学会 第86回全国大会 会期:2024年3月15日~17日

4B-04
転移学習を用いた小規模データセットで学習可能な手書き文字と印刷文字の分類モデル
○東井俊輔,南葉宗弘(東京学芸大)
印刷文字と手書き文字を識別することは、正しい文字認識には必要な処理となる。既存の研究では、文字認識用に作られたデータセットによって手書き文字と印刷文字の分類を行っている。しかし文字認識用のデータセットでは、その言語や、スタイルに依存することになり、他の言語への汎化性が乏しい課題がある。
そこで、手書き文字と印刷文字の識別だけであれば言語自体の特徴に依存しないため、小規模なデータセットで学習したモデルによって、データセットに含まれていない言語であっても特徴を抽出することができる。数字のみのデータセットで学習したモデルを転移学習を用いて再学習することによって、異なる言語でも手書き文字と印刷文字の認識を行うことができた。