4Q-03
HTML文書構造を利用したWeb検索結果クラスタリング手法の有効性について
○阿部寛之,松原雅文,Goutam Chakraborty,馬淵浩司(岩手県大)
自分が知らない単語の語義を調べる際に用いる国語辞典などには新出単語や専門用語が収録されていないことが多い.
だが,Webではそういった情報でも多く流通しているため,検索エンジンを用いた調査は日常化している.
しかし,個人からの情報発信が容易になりWebが肥大化しているため,目的とする情報に到達することが困難になってきている.
本研究では,X-means法によるハードクラスタリングを行い,Webページ内のリンク数やHTML構造を利用することにより,対象とする検索単語についてスニペットを自動生成することで,情報検索効率を向上させることを目的としている.

footer 著作権について 倫理綱領 プライバシーポリシー セキュリティ 情報処理学会