2C-3
拡大アンカーテキストを利用し偏りにも考慮したフォーカスドクローラについて
○遠藤雅樹,大野成義,高谷大二郎(能開大)
一般的な検索エンジンはクローラで世界中のWebページを収集してい
る.これに対してフォーカスドクローラは特定の分野のページのみ
を収集する.効率良く特定分野のページを収集するため,拡大アン
カーテキスト,つまりアンカーテキストだけでなくその周辺文字列
を考慮した方が良い.更に収集したページがほとんど同じページば
かりにならないように偏りを考慮して収集することも必要である.
このように拡大アンカーテキストを利用し,収集したページ内容の
偏りも考慮したフォーカスドクローラを開発したので報告する.

footer 情報処理学会 セキュリティ プライバシーポリシー 倫理綱領 著作権について