2S-07
文書表現モデルsent2vecを用いた抽出的要約の生成手法
近年、自然言語処理の分野では、与えられた文書を自動で要約するタスクが話題となっている。一方で、深層学習を用いて文の意味を分析するために、文や文書を特徴ベクトルとして表現するsent2vecが提案されている。本研究では、与えられた文書を文単位でsent2vecを用いて変換し、それを束ねた行列表現に対し、PCAやICAを適用することで、トピックを表現するコンテキストベクトルを取得する手法を明らかにした。さらに、このコンテキストベクトルを用いて、文書を意味的に分類することや、文書の要約となる重要文の抽出を行う手法を提案する。