Techniques for Improving Transition-based Dependency Parsing Algorithms

(邦訳:遷移型依存構造解析改善のための技術に関する研究)

 
林 克彦
NTTコミュニケーション科学基礎研究所

[背景]統計的手法との融合により機械翻訳の性能が飛躍的に向上
[問題]構文構造が異なる言語間での機械翻訳
[貢献]構文構造解析器の高精度化と解析結果の重複除去法


 近年,統計的手法との融合により機械翻訳の性能は飛躍的に向上した.また,インターネットを介して,多様な言語間(英語,中国語,アラビア語,日本語など)の翻訳を瞬時に行うことができるサービスも多く提供されており,幅広いユーザから支持されている.

 しかし,その一方で,日本語と英語のように言語の持つ構文構造が大きく異なる言語間では,その翻訳精度が不十分であることが指摘されている.言語間における構文構造の違いを明らかにし,それをモデル化するためには,文の構文を解析するための手法が必要となる.この問題はコンピュータサイエンスの分野でも良く知られている構文解析と呼ばれる研究領域である.

 構文解析は言語処理分野において古くから研究されているが,その精度改善は未だに重要な研究課題となっている.また,1つの文に対して,複数の構文構造を出力しようとすると,一部の解析アルゴリズムでは同じ解析結果をいくつも出力してしまうという問題が残っている.これは分野ではSpurious Ambiguityと呼ばれている問題であり,図に示すような状況を指す.本研究では構文解析法の精度を向上させるために新たなアルゴリズムを提案すると同時に,その手法をさらに発展させることで,Spurious Ambiguityの問題を理論的に解決するための手法を提案している.

 Spurious Ambiguityの問題を解消することの意義は複数の構文解析結果を機械翻訳システムへの入力とするような場合に,翻訳処理速度や性能改善の面で大きな貢献がある.従来の構文解析法は複数の構文解析結果のうち約20%から40%が他の候補と重複した解析結果となっていたが,提案法ではこのような重複した解析結果は全く含まれないことが保証されている.また,提案法による構文解析結果を機械翻訳へ応用したところ,性能の改善が確認された.

 提案した手法は機械翻訳のみでなく,構文解析結果を利用する多くの言語処理システムにも貢献できるものであり,その価値は大きいと言える.
 (2013年7月1日受付)
取得年月日:2013年3月
学位種別:博士(工学)
大学:奈良先端科学技術大学院大学



推薦文
:(自然言語処理研究会)


従来のTransition-baseの係り受け解析がボトムアップ解析であったのに対し,トップダウンのTransition-baseアルゴリズムを提案し,高い解析性能が可能であることを示した.また,これらの解析法が持つ冗長性の問題を回避する方法を提案し,速度,精度の面で高効率な解析森からのリランキング法を提案した.新規性,実用性において優れた研究である.


著者からの一言


構文解析に関する研究は古くから行われており,その問題点を見つけることは簡単なことではありませんでした.また,問題点が見つかったとしても,それを解決するための手法を考えることは大変難しい作業でした.今後は提案した構文解析法を機械翻訳や意味解析などへ応用展開していくことを考えています.