情報処理学会ホームページ
FIT2013第12回情報科学技術フォーラム 開催日:2013年9月4日(水)~6日(金) 会場:鳥取大学鳥取キャンパス
抄録
D-013
語の共起による文書グラフの構築とPageRankを導入した重要語抽出法
今井智宏・望月久稔(大阪教育大)
 文書解析は,分類や要約,意味の抽出による意見分析など多種多様に利用でき,解析方法には文書の特徴を表す語である重要語を抽出する方法がある.これまでの研究には頻度情報を用いた統計的なアプローチがあり,人手による解析よりも高速であるが,精度は人手より低く,特に語のつながりを解析することは難しい.
 本稿は語の共起によるグラフを構築し,グラフ解析の手法であるPageRankを導入し,構築したグラフを解析することで重要語を抽出する方法を提案する.重要語を用いて文書を分類し,提案手法による抽出と頻度情報を用いた抽出を比較することで精度を評価する.