(邦訳:統語的・意味的依存構造解析に関する研究)
大内 啓樹 理化学研究所/東北大学 |
[背景]統語的・意味的依存構造解析手法の発展
[問題]各単語の構文的特徴の利用法と複数述語のモデリング法
[貢献]Supertagの開発と複数述語を考慮した解析手法の開発
依存構造解析は,単語間の関係を当てるタスクである.一言で「単語間の関係」といってもいろいろな関係がある.たとえば,主語や目的語などの文法的関係や「いつ,どこで,誰が,何を,どうした」といった意味的関係がある.これらの関係を当てるタスクを統語的依存構造解析,意味的依存構造解析という.どちらのタスクも,自然言語処理研究の基礎的な問題として,これまで多くの研究がなされ,情報抽出などに広く応用されている.
本研究では,これら2つのタスクにおける解析精度の高度化を行った.それぞれ,以下の観点から解析精度向上を目指した.
■統語的依存構造解析
[課題]:各単語の構文的特徴の利用
本研究では,これら2つのタスクにおける解析精度の高度化を行った.それぞれ,以下の観点から解析精度向上を目指した.
■統語的依存構造解析
[課題]:各単語の構文的特徴の利用
He | will | give | you | a | present | . |
S | V | O | O |
上記の例のように,“give”という単語はその後ろに2つの目的語(O)を取りやすい.このように,ある単語がどのように文法的に使われるか,事前に傾向を掴み,その情報をいかに依存構造解析に利用するかがポイントとなる.
[解決策]:Supertagの開発と自動付与
本研究では,構文的情報を品詞タグ(動詞を表す“V”や名詞を表す“N“といったもの)のようなタグ(Supertag)として定義した.依存構造解析前にそれらのSupertagを各単語に自動付与し,解析の手がかり(特徴量)として依存構造解析に用いた.多言語のデータセットを用いた実験により,本手法の有効性を示した.
■ 意味的依存構造解析
[課題]:省略された単語の解析
意味的依存構造解析で解析が困難な例として,主語の省略が挙げられる.
警察は男を逮捕したが,(男が)数日後に逃走した.
上記の例では,述語「逃走した」の主語(動作主)にあたる「男」が省略されている.このような省略は日本語・中国語・イタリア語などで頻繁に観測され,有効な解析方法が望まれている.
[解決策]:複数述語間知識の考慮
本研究では,複数の述語間の関係を考慮することにより,これらの解析精度の向上を図った.たとえば,上記の例において「誰が逃走したか?(「逃走した」の動作主にあたる単語)」を当てたい場合を考えると,「逮捕された人物」が「逃走した人物」である可能性が高いことが直感として分かる.このように,複数の述語間の関係を考慮することによって,省略された単語を当てやすくなると期待できる.日本語のデータを用いた実験により,本手法は省略された単語を有効に解析可能であることが分かった.

(2018年5月31日受付)