5P-02
文書間類似度を用いたWebページからの応答文収集
対話システムで利用する質問応答データベースにおいて、未知の質問例に対する応答文を新たに追加することでデータベースの拡張を行う研究は多くある。しかし、近年盛んに研究されているニューラルネットワークを用いた応答文選択では、質問応答データベースに存在するような質問例は存在しないため、従来の手法を利用することはできない。
そこで、本研究では、既存の応答文集合をもとに、新たな応答文を自動取得する手法を提案する。本手法では、応答文集合とWebページの本文との類似度を計算し、応答文集合と内容が類似しているページを特定する。そして、そのページから応答文として適切な文を抽出し、応答文集合に加えることを目指す。
そこで、本研究では、既存の応答文集合をもとに、新たな応答文を自動取得する手法を提案する。本手法では、応答文集合とWebページの本文との類似度を計算し、応答文集合と内容が類似しているページを特定する。そして、そのページから応答文として適切な文を抽出し、応答文集合に加えることを目指す。