1T-05
Webニュース記事によるツイート分類に関する一検討
○今井克真,小林亜樹(工学院大)
文書分類技術の一つとして,文書データによるLDAトピックモデルが用いられている.しかし,文書長が短く,語彙にも偏りがあるとされるtweetに対しては,あまり有効ではないとされてきた.本稿では,Web記事で言及されている物事(ここではイベントと呼ぶ)に対して,tweetがどのイベントへの言及であるかを判別するという観点において,LDAトピックモデルに基づき,tweet単独での類似度分布がどのようになっているか,事例を基に検討する.
カテゴリ分類したWeb記事本文を1文書として,LDAトピックモデルを構築する.得られたLDAトピックモデルに対して,記事-tweetのトピックベクトル生起空間におけるcos類似度を求めた.

footer 著作権について 倫理綱領 プライバシーポリシー セキュリティ 情報処理学会