情報処理学会ホームページ
FIT2014 第13回情報科学技術フォーラム 開催日:2014年9月3日(水)~5日(金) 会場:筑波大学筑波キャンパス 一般社団法人電子情報通信学会 情報・システムソサイエティ 一般社団法人電子情報通信学会 ヒューマンコミュニケーショングループ 一般社団法人情報処理学会 筑波大学
抄録
RD-003
Designing Test Collections That Provide Tight Confidence Intervals
酒井哲也(早大)
In this study, we show a method for determining the topic set size n for researchers who are trying to build a new test collection, by requiring a tight confidence interval (CI) for the difference between any given pair of systems X and Y.
By applying this method with estimates of the population variance from past data (i.e., existing test collections), more reliable test collections can be built for similar tasks.
Specifically, we show that evaluation measures should be chosen at the test collection design phase, and that
a tight CI can be achieved at a low cost by having many topics with shallow document pools.