6N-01
共起関係と係り受け関係を用いた文書グラフによる重要語抽出法の提案
○今井智宏,望月久稔(大阪教大)
ビッグデータにおいて,本論は重要語の抽出を取り扱う.ある文書の特徴を表す語を重要語として,これを抽出することで文書分類や評判分析への応用が期待できる.
日本語の構造に係り受け関係があり,これを考慮することで,頻度だけに依存せず,より日本語の特徴に則して解析できると考える.そこで,言語的特徴として共起関係と係り受け関係を取り入れた文書グラフの構築法を提案する.このグラフを解析することで特徴ベクトルを算出して,重要語を抽出する.
係り受け関係と重要語抽出との相関について評価する.さらに,頻度情報などを用いた他手法と精度の比較で評価する.