3C-6
An Efficient Window-Based Methods Using N-gram Indexing for Approximate Entity Extraction
○木村光樹(東大),高須淳宏,安達 淳(国立情報学研)
Approximate Entity Extractionでは,クエリ文書中から辞書中のentityと類似した部分文字列を検索する.
このときentityの出現位置が不明であることが.問題を複雑化している.この問題に対処するために,索引を用いて出現位置の特定を行い,entityの索引語と一致した文書中の部分文字列の前後の距離を計算することで,解を得る手法が提案されている.
しかしながら,この手法ではentityも複数の索引語をもつが,その特徴を使用しておらず,無駄な距離計算が発生している.
そこで本稿では,クエリ文書中に適切な窓を設定し,その窓内での索引語の出現数を考慮することで,距離計算の削減を行う手法を提案する.

footer 情報処理学会 セキュリティ プライバシーポリシー 倫理綱領 著作権について