3S-2
数式構造と周辺テキストの両面を考慮した数式情報抽出
○横井啓介(東大),Minh NGHIEM(総研大),松林優一郎(国立情報学研),相澤彰子(東大)
数式は、主に科学論文等において、豊富な意味を含んだ情報伝達媒体である。
しかし、その独特な構造からか現時点では数式を情報検索に有効に活用されている例は現時点では存在しない。
これまでの数式検索に関する研究の多くは数式構造そのもの"のみ"を扱っているものが多かったが、数式はそれだけでは曖昧性を多く含んでおり、数式の持つ深い意味を理解するためにはその周辺テキストも考慮することが不可欠である。
我々は、科学論文中の数式に焦点をあて、各数式中の変数名、関数定義など数式に関する情報を抽出し、数式構造と共に扱うことで、表層のみでなく意味的にも類似した数式検索や、科学論文を読む際の適切な情報掲示を可能にした。本稿ではそれらの提案手法の有効性を、それぞれ実験結果と共に示す。