6P-03
確率的TF-IDFを用いた特徴語抽出と文書検索
○三浦大輝,三浦孝夫(法大)
本研究では単語頻度と文書頻度により単語に重みを与えるTF-IDFを単語の出現確率P(x)を用いて推定し、この確率的TF-IDFを用いて特徴語抽出とTwitterなどの短文検索に利用できるかを検証する。この検証により、Twitterなどの文書数の変動が激しいデータに対して、(文書数を数えることなく)単語に重みを与え検索することが可能になる。

footer 著作権について 倫理綱領 プライバシーポリシー セキュリティ 情報処理学会