情報処理学会 第87回全国大会

2Q-09
BARTを用いたネイティブ英語への事後編集モデル
○富田悠斗,村上陽平(立命館大)
機械翻訳の出力がネイティブ話者にとって自然ではない場合がある. ネイティブ話者にとって自然な出力にする手法として, 事後編集を用いる場合がある. 本研究では, 人手によって行われるこの手法の自動化を行う. 具体的には, 事前学習済みモデルを用いたニューラルネットワークによる同一言語間で変換を行う. BERTを用いたネイティブ英語分類器の構築を行い, その分類器を用いた対訳コーパスを作成する. BARTを用いて作成した対訳コーパスをファインチューニングし, 事後編集による出力がネイティブ英語であるか分類器を用いて推論を行う. この手法により, 自動化された事後編集が英語母語話者スタイルへの変換として概ね有用であることが示された.