抄録
F-008
オフライン全文検索エンジンを用いた文字列間の正規化類似度距離
佐藤 哲(楽天)
ユニバーサル符号の理論を応用した汎用的な類似度計算法が研究されているが,その強い汎用性のあまり例えば日本語文章間の類似度など分野を特化した場合に実用性が下がることがある.そこで本発表では,検索エンジンを利用した類似度計算法に着目し,検索エンジンのコンテンツ及び解析器をオフラインの学習機として用意しておくことで,対象分野に特化した類似度距離を計算する方法を紹介する.