6T-3
複雑ネットワークからのキーワード抽出
○三澤英樹,大沢英一(はこだて未来大)
インターネットの普及,文書の電子化が進み,文書の数は膨大な量になっている.その一方で,人々はこの膨大な文書の中から自分の望んだ文書を探すのは困難になっている.このことを助ける手段としてキーワード抽出が挙げられる.キーワード抽出法としてしばしば用いられているtfidfがある.しかし,この手法は使用するコーパスの情報によって結果が左右されてしまうという欠点がある.コーパスを使用しないキーワード抽出として松尾らは,共起グラフが複雑ネットワークであることを証明し,Small World 構造に基づいたキーワード抽出アルゴリズムを提案した.本論文では,語の共起グラフの構造的特徴を調査し,ネットワーク構造の特徴量が与える抽出結果の変化を調査する.