6Q-1
Geometric Algebra を用いた英語文書分類手法の日本語文書への適用に関する問題についての基礎的検討
○鈴木直人,古橋 武,吉川大弘(名大)
電子文書の普及が進み,様々な場面で膨大な量の文書を管理する必要が生じている.このような文書管理においては,文書分類が不可欠となる.これまで,tf-idfや潜在意味解析(LSA)を用いた文書分類手法が報告されているが,これらの多くは単語の出現順序を考慮していない.これに対し,英語文書において,Geometric Algebra (GA) を用いることで,単語の出現順序を考慮して文書分類を行う手法が提案されている.この手法では,LSAに基づき,単語の出現順序に応じた回転ベクトルを定義することで,各文書が出現する単語の順序に応じて回転され,その最終状態の違いにより文書分類を行っている.本稿では,この手法を日本語の文書分類に適用する際に生じる問題点などについて検討を行う.

footer 情報処理学会 セキュリティ プライバシーポリシー 倫理綱領 著作権について