(邦訳:談話処理における世界知識の利用:素性ベースアプローチおよび推論ベースアプローチの比較)
井之上 直也 東北大学大学院情報科学研究科 研究員/(株)デンソー基礎研究所 |
[背景]世界知識の自動獲得技術の発展とビッグデータ時代到来により,超大規模な世界知識ベースが利用可能に
[問題]獲得した大規模世界知識を有効に利用するための談話処理の枠組みの研究がほとんど進んでいない
[貢献]アブダクションにもとづく談話処理の枠組みの提案,アブダクションの仮説探索の高速化・教師あり学習手法の提案,照応解析への応用
[問題]獲得した大規模世界知識を有効に利用するための談話処理の枠組みの研究がほとんど進んでいない
[貢献]アブダクションにもとづく談話処理の枠組みの提案,アブダクションの仮説探索の高速化・教師あり学習手法の提案,照応解析への応用
談話処理とは自然言語処理における問題領域のひとつであり,入力された文章に対し,その中で展開される談話の文脈を捉え,文章中には明示的に述べられていない潜在情報を復元する処理を指す.談話処理の実現には,事象間の因果関係などの世界知識の大規模なデータベースが必要であるが,これについては近年大規模言語データからの自動知識獲得などの研究が進み,広く利用可能な資源が整備されつつある.しかしながら,こうした大規模な知識ベースを効果的に談話処理に利用する枠組みについてはほとんど研究が進んでいないのが現状である.
この問題に対し,本研究では,論理推論の一種であるアブダクション(仮説推論)に注目し,大規模知識ベースを用いた談話処理をアブダクションにもとづいて実現する方法を提案している.その貢献は,第1に,(a)一階述語論理上でのアブダクションを劇的に高速化する方法を提案したこと,第2に,(b)アブダクションの評価関数を訓練事例から学習する方法を提案したこと,そして第3に,(c)アブダクションによる推論ベースの談話処理を,従来の素性ベースの機械学習による談話処理と融合させながら実現する方法を示したことである.
一階述語論理にもとづくアブダクションの高速化手法の研究では,(1)一階述語論理にもとづくアブダクションを命題論理上にマップせずに,一階述語論理上での推論を直接実現する方法を示し,(2)それを整数線形問題に落とし込むことにより,劇的な高速化が実現できることを実験により示している.論理推論にもとづく談話処理の実現には,一階述語論理上での推論が大変重要な役割を果たすが,推論の計算コストが非常に高いため,推論効率のボトルネックを大幅に解消することは重要な課題である.
アブダクションの教師あり学習の枠組みの研究では,マージン最大化原理にもとづく並列オンライン学習を用い,アブダクションの学習を実現する枠組みを提案している.また,アブダクションの学習を実際に談話処理に適用する際に,開世界仮説を仮定した学習(解仮説の一部の真偽値を「不明」とした学習)が重要であることを示し,その実現方法を示している.
照応解析への応用の研究では,開発した推論手法と学習手法を,談話処理の一種である「照応解析」(言語表現の指示対象を解析するタスク)に適用するために,従来の素性ベースの談話処理手法とアブダクションにもとづく推論ベースの手法を融合し,談話処理を実現する枠組みを提案している.従来の素性ベースの手法では,照応詞に対して意味的な整合性のある先行詞が複数存在する場合,システマチックに先行詞を決めるのが難しいという問題があったが,推論を取り入れることで,この問題が解消できることを示している.また,推論を取り入れたことの効果を,大規模な知識ベースと実在の問題の上で実験的に検証し,考察を深めている.実規模のデータ上で,tractable な推論エンジン・学習手法を用いて推論ベースの手法を検証することは,これまでにない新しい試みである.
この問題に対し,本研究では,論理推論の一種であるアブダクション(仮説推論)に注目し,大規模知識ベースを用いた談話処理をアブダクションにもとづいて実現する方法を提案している.その貢献は,第1に,(a)一階述語論理上でのアブダクションを劇的に高速化する方法を提案したこと,第2に,(b)アブダクションの評価関数を訓練事例から学習する方法を提案したこと,そして第3に,(c)アブダクションによる推論ベースの談話処理を,従来の素性ベースの機械学習による談話処理と融合させながら実現する方法を示したことである.
一階述語論理にもとづくアブダクションの高速化手法の研究では,(1)一階述語論理にもとづくアブダクションを命題論理上にマップせずに,一階述語論理上での推論を直接実現する方法を示し,(2)それを整数線形問題に落とし込むことにより,劇的な高速化が実現できることを実験により示している.論理推論にもとづく談話処理の実現には,一階述語論理上での推論が大変重要な役割を果たすが,推論の計算コストが非常に高いため,推論効率のボトルネックを大幅に解消することは重要な課題である.
アブダクションの教師あり学習の枠組みの研究では,マージン最大化原理にもとづく並列オンライン学習を用い,アブダクションの学習を実現する枠組みを提案している.また,アブダクションの学習を実際に談話処理に適用する際に,開世界仮説を仮定した学習(解仮説の一部の真偽値を「不明」とした学習)が重要であることを示し,その実現方法を示している.
照応解析への応用の研究では,開発した推論手法と学習手法を,談話処理の一種である「照応解析」(言語表現の指示対象を解析するタスク)に適用するために,従来の素性ベースの談話処理手法とアブダクションにもとづく推論ベースの手法を融合し,談話処理を実現する枠組みを提案している.従来の素性ベースの手法では,照応詞に対して意味的な整合性のある先行詞が複数存在する場合,システマチックに先行詞を決めるのが難しいという問題があったが,推論を取り入れることで,この問題が解消できることを示している.また,推論を取り入れたことの効果を,大規模な知識ベースと実在の問題の上で実験的に検証し,考察を深めている.実規模のデータ上で,tractable な推論エンジン・学習手法を用いて推論ベースの手法を検証することは,これまでにない新しい試みである.

(2013年6月14日受付)