FIT2016 第15回情報科学技術フォーラム 開催日:2016年9月7日(水)~9日(金) 会場:富山大学キャンパス
抄録
RD-001
特定分野を対象とした単語重要度計算手法の提案と Twitterにおける専門性推定への適応
滝川真弘(早大)・山名早人(早大/NII)
Twitterユーザを対象として,ユーザの属性や専門性を推定するための研究が近年増加している.Twitterの特徴として,一度に投稿できる文字数は140文字と短い点がある.そのため多くの研究では,複数の投稿からベクトルを生成し,特徴量としている.しかし,少数の投稿から特徴量を適切に抽出できれば様々な応用が広がる.そこで本研究では,投稿内の各単語を重点的に考慮して推定することを想定し,特定分野に対する単語の重要度を事前に付与する手法を提案する.提案手法では,特定分野でのみ扱われ,かつ特定分野の中でも少数の人間しか扱わない単語ほど重要な単語として重みづけを行う.そして,Twitterを対象としたユーザの専門性推定に適用し評価する.提案手法と既存手法それぞれを使用して生成したランキングと,人手により作成した正解ランキングとの,スピアマンの順位相関係数を用いて評価した.結果として,提案手法は,相互情報量を用いた従来手法より相関係数が0.05高くなり,提案手法の有効性を確認した.