2P-4
語の関係性を抽出した特徴ベクトルによる文書分類の提案
○今井智宏,望月久稔(大阪教大)
 ウェブ上には多種多様な人によって非常に高い頻度で様々な文書が更新される.しかしこれらは基本的に整理されておらずそのままの状態で利用することは難しい.自動で解析し,分類することができれば,市場調査や動向調査などの利用が期待できる.
 そこで本稿は,まず語の共起関係からグラフを構築し解析することで、文書中に出現した語の重要度を表す特徴ベクトルを抽出する.続いて抽出した特徴ベクトルに対しk近傍法を用いることで文書を分類する.実験には日本語のウェブ記事であるITproを使用し,日本語の文書に対する分類精度を評価する.

footer 情報処理学会 セキュリティ プライバシーポリシー 倫理綱領 著作権について