情報処理学会ホームページ
FIT2013第12回情報科学技術フォーラム 開催日:2013年9月4日(水)~6日(金) 会場:鳥取大学鳥取キャンパス
抄録
A-030
Geometric Algebra を用いた文のベクトル化手法における計算量の改善に関する検討
鈴木直人・吉川大弘・古橋 武(名大)
電子文書の普及とともに,様々な状況で膨大な量の文書を管理する必要が生じている.こうした場合には,文書のベクトル化などの方法を用いて文書分類を行うことが必要となる.これまで,tf-idfや潜在意味解析(LSA)を用いた文書分類手法が報告されているが,これらの多くは単語の出現順序を考慮していない.これに対し,Geometric Algebra (GA) を用いることで,単語の出現順序を考慮した文のベクトル化手法が提案されている.この手法では,LSAに基づき,単語の出現順序に応じた回転ベクトルを定義することで,各文の出現単語順に対応する回転ベクトルを掛けてその文ベクトルが計算される.本稿では,この手法における計算量の問題点及びその改善方法について検討を行う.