4V-05
小説の内容を表すキーワードの抽出に関する研究
○若井龍弥(電通大),大久保誠也(静岡県大),若月光夫,西野哲朗(電通大)
小説の内容を端的に表すものとして、キーワードというものがある。しかし、キーワードには作者が事前に付与しなければならないという問題がある。この問題を解決する手法として、キーワードの自動抽出がある。本研究では、より小説の内容に沿ったキーワードを抽出することを目的とし、新たな抽出手法を提案する。自動抽出として広く用いられているTF-IDF法により抽出されたキーワードと、TF-IDF法によるスコア付けに加えてWord2Vecで作成した学習モデルを利用した新しい抽出手法を比較し、どちらの抽出手法がより小説の内容を表す重要語を抽出できているかを被験者実験により確認する