情報処理学会ホームページ
FIT2013第12回情報科学技術フォーラム 開催日:2013年9月4日(水)~6日(金) 会場:鳥取大学鳥取キャンパス
抄録
I-010
文字を構成する線画の組合せの機械学習
草野周太・酒井智弥(長崎大)
本研究では,文字画像から文字らしさを抽出するために必要な辞書の学習を行った.文字はいくつかの線画が組み合わさって構成されている.ゆえに,文字画像はいくつかの典型的な線画の画像の組合せによって合成できると考える.
正規化された漢字画像の集合が与えられたとき,まず(1)漢字画像の構成要素を学習する.次に(2)構成要素の組合せを学習する.提案手法では,2つの学習にスパースコーディングを利用する.
(1)の学習では,基底画像の枚数が多い場合,漢字画像の数枚がそのまま基底として採用され,少ない場合,頻出する偏や旁などを抽出する傾向がみられた.(2)の学習では,(1)の学習に依存せず文字らしさを表現できた.