情報処理学会ホームページ
FIT2013第12回情報科学技術フォーラム 開催日:2013年9月4日(水)~6日(金) 会場:鳥取大学鳥取キャンパス
抄録
D-014
対訳コーパスに基づく最適なローマ字化システムの構築
田口惠子(同志社大)・Andrew Finch(NICT)・山本誠一(同志社大)・隅田英一郎(NICT)
すでに書記素レベルでのバイリンガルアライメントから直接ローマ字化システムを開発する方法を提案した.提案手法はベイジアンアプローチを用いて対訳ペアを書記素ごとに対応付けすることによってカタカナをいかにローマ字化すべきか学習を行い,変換ルール候補を生成する.その変換ルール候補からユーザー定義の基準に従い最適なローマ字化変換ルールを一意的に選択する.更にトランスリテレーションマイニングタスクに開発したローマ字化システムを適用しトランスリテレーションマイニングの性能を比較した.本稿ではローマ字化システムの効果について考察する時に提案したローマ字化システムが他言語にも適用可能であるかの検証を行った.