抄録
CN-004
くずし字の検出および認識を行うスタンドアロンシステムの開発
早坂太一・竹内正広・大野 亙(豊田高専)・加藤弓枝(鶴見大)・山本和明(国文学研究資料館)・石川徹也(TRC-ADEAC)
本研究では,国文学研究資料館が作成し,ROIS-DS人文学オープンデータ共同研究センターが公開している110万字を超えるくずし字データセットにデジタルアーカイブシステムADEAC内の古典籍画像から抽出した字形データ約26,000字を加えて,16ビットUnicodeにくずし字を分類する畳み込みニューラルネットワークの学習を行った.さらに,そのモデルをシングルボードコンピュータRaspberry Piに実装することで,複数のくずし字を一括して自動検出し,認識を行うことのできるスタンドアロンシステムを開発した.インターネットへの接続を必要としないため,小中学校での教育や古民家での調査などの場面で手軽に利用でき,くずし字翻刻の支援ツールとして活躍することが期待できる.