5C-5
係り受け構造アライメントを用いた文間の差異箇所認識
○小林幹門,篠崎政久,加納敏行(東芝ソリューション)
社内規程や開発ドキュメントといった文書では、文書間に参照関係があったり、基本となる文書とその派生といったような関係にある文書が存在する。
そのような文書間では、一方の文書に変更が生じた場合、その変更が他の文書へ影響を与えることがある。
このような時に、内容の矛盾や記載漏れが無いように整合性が確保された状態を保つため、従来は人手により不整合箇所を見つけていた。
しかしながら、確認対象の文書数が大量になると、膨大な時間とコストが掛かったり、人手で発見するも無理になってしまう。
以上の課題に対し、本稿では文書間の類似部分を文のまとまりで検出し、
さらに、類似部分の差分を係り受け構造および語幹のアライメントを用いて
差異箇所を提示する手法を提案する。本手法により記載事項の相違が生じやすい類似部分と、その差異を提示することが可能となり、不整合箇所の発見を効率化することができる。