抄録
CD-002
ユーザの感覚に近い多様化検索評価指標
酒井哲也・Zhaohao Zeng(早大)
ウェブ検索エンジンに入力されるクエリには,検索意図が十分に詳細に記述されていないものや多義性による曖昧さを含むものが多い.これに対処する検索技術に検索結果多様化がある.多様化検索の主要な評価方法に,TREC (Text Retrieval Conference)で用いられてきたIntent-Awareな評価指標と,NTCIR (NII Testbeds and Community for Information Access Research)で用いられてきたD#-measuresがある.また最近,一連の公理を満たす多様化検索指標としてRBU (Rank-Biased Utility) も提案されている.検索評価指標は検索エンジンの改良やチューニングの要であるため,ユーザの感覚を反映していることを保証する必要がある.そこで本研究は,多様化検索評価指標が検索結果ページの対に下した優劣の判断が人間の判断の何割と合致するかを定量化し,この観点からD#-measuresが最も優れていることを統計的観点から明らかにする.