A Study on Syntactic and Semantic Dependency Parsing

(邦訳:統語的・意味的依存構造解析に関する研究)
 
大内 啓樹

理化学研究所/東北大学

[背景]統語的・意味的依存構造解析手法の発展
[問題]各単語の構文的特徴の利用法と複数述語のモデリング法
[貢献]Supertagの開発と複数述語を考慮した解析手法の開発
 
 依存構造解析は,単語間の関係を当てるタスクである.一言で「単語間の関係」といってもいろいろな関係がある.たとえば,主語や目的語などの文法的関係や「いつ,どこで,誰が,何を,どうした」といった意味的関係がある.これらの関係を当てるタスクを統語的依存構造解析,意味的依存構造解析という.どちらのタスクも,自然言語処理研究の基礎的な問題として,これまで多くの研究がなされ,情報抽出などに広く応用されている.

 本研究では,これら2つのタスクにおける解析精度の高度化を行った.それぞれ,以下の観点から解析精度向上を目指した.

■統語的依存構造解析
[課題]:各単語の構文的特徴の利用
 
He will give you   a present .
S   V O   O  

 上記の例のように,“give”という単語はその後ろに2つの目的語(O)を取りやすい.このように,ある単語がどのように文法的に使われるか,事前に傾向を掴み,その情報をいかに依存構造解析に利用するかがポイントとなる.

[解決策]:Supertagの開発と自動付与
 本研究では,構文的情報を品詞タグ(動詞を表す“V”や名詞を表す“N“といったもの)のようなタグ(Supertag)として定義した.依存構造解析前にそれらのSupertagを各単語に自動付与し,解析の手がかり(特徴量)として依存構造解析に用いた.多言語のデータセットを用いた実験により,本手法の有効性を示した.


■ 意味的依存構造解析
[課題]:省略された単語の解析
 意味的依存構造解析で解析が困難な例として,主語の省略が挙げられる.

 警察は男を逮捕したが,(男が)数日後に逃走した

 上記の例では,述語「逃走した」の主語(動作主)にあたる「男」が省略されている.このような省略は日本語・中国語・イタリア語などで頻繁に観測され,有効な解析方法が望まれている.

[解決策]:複数述語間知識の考慮
 本研究では,複数の述語間の関係を考慮することにより,これらの解析精度の向上を図った.たとえば,上記の例において「誰が逃走したか?(「逃走した」の動作主にあたる単語)」を当てたい場合を考えると,「逮捕された人物」が「逃走した人物」である可能性が高いことが直感として分かる.このように,複数の述語間の関係を考慮することによって,省略された単語を当てやすくなると期待できる.日本語のデータを用いた実験により,本手法は省略された単語を有効に解析可能であることが分かった.
 

 
(2018年5月31日受付)
取得年月日:2018年3月
学位種別:博士(工学)
大学:奈良先端科学技術大学院大学



推薦文
:(自然言語処理研究会)


本論文は,自然言語テキストに内在する単語や句の文法的・意味的な相互関係をモデル化し,それらを高精度に推定する一連の手法を創出したものである.これは情報科学,特に自然言語処理の発展に寄与する実用的な成果であり,国際的にも高く評価されているため,研究会推薦博士論文として推薦する.


研究生活


奈良には3つのものがあるといわれている.大仏,鹿,依存構造解析.私はそのうちの1つを研究したにすぎない.小ガモが親ガモのあとをついていくように,言語処理研究者として生まれたての私が頻繁に目にしたのが依存構造解析だった.文が書かれたホワイトボード.単語と単語の間に矢印の弧が描かれ,この弧は間違いだ,この弧は本来こっちにかかるべきだ,などといったように議論は平行線をたどり,太陽は地平線に沈む.自分も平行線の一部となるべく,オリジナルの解析器をつくり始めた.解析器が休みなく弧を描き続け,その弧がどれほど完璧なものに近づいたかを論文に書く.つくり続けて書き続け,ゴールは見えずとも次の議題が生まれ,また議論が行われる.そのような過程が心地良いものだったのは,周りの人が付き合ってくれたからだなと実感しています.お世話になりました.