5Q-5
統計翻訳における探索空間の最適化
○中島正裕,山本博史(近畿大)
統計翻訳では、パラレルコーパスから翻訳モデルを構築し、翻訳元
文に対して、最も確率が高くなるような翻訳先文を見つける。しか
し、このためには本来全ての可能性がある翻訳文に対する確率値を
計算する必要があるため、探索空間は膨大なものになる。この探索
空間の削減のために用いられるのが、スタックデコーダと呼ばれる
手法であり、この手法では、翻訳済みの単語数が同じものに対して
は上位一定個数(スタックサイズ)の仮説のみを計算することで、
探索空間の削減を行っている。統計翻訳では、語順入れ替えを考慮
しなければならないため、語数が増えるほど探索空間は大きくなっ
てしまう。そこで、本研究では翻訳元文の語数や情報量に応じてス
タックサイズを変化させることで、探索空間の削減を図る。

footer 情報処理学会 セキュリティ プライバシーポリシー 倫理綱領 著作権について