抄録
E-016
クラメールの連関係数を援用した類似文書検索システムの提案
◎槫松理樹(岩手県大)
膨大な電子文書が入手可能である現在、それらを効率良く処理する手段の一つとして、類似文書検索は重要である。従来の類似文書検索においては、文書ベクトルによる検索が主流であった。これに対し、本研究では、クロス集計などに用いられるクラメールの連関係数を用いることで、文書間の類似度を計算する手法を提案する。本手法を評価するために、プロトタイプを構築し、特許を対象とした評価実験を行った。その結果、本手法が有用である可能性を示せた。