3R-8
カタカナ抜け文のための自動解法アルゴリズムの提案
○島 広幸(工学院大),建石由佳(ナラプロ・テクノロジーズ),小西克己(工学院大)
文字パズルの一種であるカタカナ抜け文を機械的に解く方法を提案する。
カタカナ抜け文とは、カタカナ語が抜けている文章を同じ文字には
同じ番号があてはめられているという制限と周辺の情報を手がかりに
復元する文字パズルである。
本研究では、抜けている部分に入る単語の候補集合を周辺に出現する
単語の共起情報を基に生成し、その候補を組み合わせて解を生成する手法を
提案する。共起情報はGoogle N-gramから求め、解生成には
A*探索アルゴリズムを用いた。
7つの問題に対し行った実験の結果、単語正解率は78.1%、
文字正解率は88.7%であった。