抄録
E-063
Web検索結果のラベリングにおける閾値の利用について
吉田俊広・松原雅文・Chakraborty Goutam・馬淵浩司(岩手県大)
本研究では,Web検索結果をクラスタリングし,生成されたクラスタに一致率を用いることにより精度の高いラベリングを行うことが目的である.Web検索結果をクラスタリングし,それにより生成されたクラスタに付与するラベルが適切であるならば,検索キーワードとこのラベルでのAND検索結果中に当該クラスタに含まれるWebページは多数存在すると考えられるため,この結果中に存在したWebページの割合を一致率として用いる.クラスタへのラベリングは,クラスタリング自体の精度にも大きく影響を受ける.本稿では,Web検索結果をクラスタリングする際,閾値を利用して次元数を制限することで,ラベリングへの影響について調査した結果を述べる.