3S-8
日本語テキストCDL化のためのエンティティ間関係の判別
○井口宜久,石塚 満(東大),内田裕士(UNDL財団)
テキストデータの爆発的な増加に伴い、自然言語テキストから如何に
情報を得るかということが重要な課題となっている。また多言語間での
情報の共有の上でも、テキストの意味を解析することが必要となっている。
こうした背景から、概念記述言語(CDL)という意味構造を記述する
形式言語が提案されている。本研究の目的は、このCDL.nlに基づく
意味構造へと日本語テキストを変換することである。しかし日本語には
意味構造についての大規模なコーパスがないため、意味構造解析においては
データのスパースネスの問題への対処が重要である。本研究では、
WordNetなどの概念辞書などを利用し小さなコーパスでも意味構造解析において
一定の精度が得られることを示した。