情報処理学会ホームページ
FIT2014 第13回情報科学技術フォーラム 開催日:2014年9月3日(水)~5日(金) 会場:筑波大学筑波キャンパス 一般社団法人電子情報通信学会 情報・システムソサイエティ 一般社団法人電子情報通信学会 ヒューマンコミュニケーショングループ 一般社団法人情報処理学会 筑波大学
抄録
E-007
日本語の文の平均像を体現した文を探す (2)平均からの距離
近藤 秀・佐藤理史・刀山将大・加納隼人(名大)
日本語の文の平均像を体現した文というものはどのような文であろうか。この問いに答えるために、本研究では、日本語に関する初めての大規模均衡コーパスである『現代日本語書き言葉均衡コーパス』を利用し、日本語の文の平均像を体現した文を探すことに取り組んだ。本論文では、この取り組みのパート2として、パート1で抽出した各文の特徴ベクトルに基づき、最も平均的な文を求める方法について検討した。具体的には、特徴ベクトルの集合に対して平均(中央)を定義し、さらに平均と特徴ベクトル間の距離を定義する。この距離を用いて最も平均像を体現した文を定める。