3P-9
Web検索エンジンを用いた分類手法の評価
○金子雅哉,岡本秀輔,小花聖輝(成蹊大)
近年、多くの文書をPDF ファイルとしてインターネット上から取得することが容易となった。そこで、本研究ではその膨大な量の文書ファイルを自動的に分類する、ドキュメント分類アルゴリズムを提案する。そのアルゴリズムは各文書から複数の単語を抽出し、単語間の類似度をweb 検索エンジンによるAND 検索のヒット数を基準にして計算する。そして、求めた各単語間の類似度をクラスタ分析手法の一つであるK-平均法に適用させることで、文書ファイルの分類を行う。本発表では提案したアルゴリズムの詳細と、その精度を評価するために行った実験とその結果について報告する。

footer 情報処理学会 セキュリティ プライバシーポリシー 倫理綱領 著作権について