6C-01
翻訳品質に基づいた専門用語の半自動抽出手法の提案
○園尾 聡,田中浩之,木下 聡(東芝)
本研究では、機械翻訳の精度向上を目的とした専門用語の半自動抽出手法を提案する。
特定の分野に適応した機械翻訳を実現するためには、その分野に適した専門用語辞書を開発することが重要な課題となる。
提案手法では、機械翻訳で誤訳となった単語を少量の教師データとし、特定分野のコーパスから得られる統計量および翻訳処理に関する特徴量を組み合わせ、専門用語辞書として追加すべき単語の抽出を行う。
IT分野の文書群を用いた評価実験において、抽出された上位1000単語が出現頻度ベースの82.2%を網羅し、専門用語辞書の開発効率が1.5倍に改善することを確認したので、その結果について報告する。

footer 情報処理学会 セキュリティ プライバシーポリシー 倫理綱領 著作権について