抄録
D-003
単語と文の分散表現素性に着目したニュースストリームに対する文単位の新規性判定
田村壮慶・青野雅樹・立間淳司(豊橋技科大)
インターネットの浸透に伴い、様々なニュース記事に大量にアクセスできるようになってきた。膨大な記事の中でユーザは本当に新鮮な記事だけアクセスしたい。そこで、本論文では、ニュースストリームを入力とし、文単位で新鮮かどうかを判定する方法を提案する。具体的には、単語と文の分散表現素性に着目した回帰モデルを作成し、新規性の判定技術を述べる。実験では、TRECのNovelty Track Dataを使った。その結果、従来手法よりも高精度に新規性が判定できることがわかった。