6L-2
ZDDとコルモゴロフ複雑性を利用したツイッターのユーザ分類
○細川拓也,Thomas Zeugmann(北大)
本研究ではゼロサプレス型BDD(ZDD)とコルモゴロフ複雑性に基づく正規情報距離を
利用して、ツイッター上のユーザをスポーツ選手や経営者などの分野に分類する手法
を提案する。正規情報距離の計算はgzipやbzip2などの汎用の圧縮ソフトウェアを
用いて近似する手法が一般的である。一方、今回のようなケースではツイートを単語
ごとに分割することで、各ユーザに対して単語の集合を要素とする組合せ集合を定義
することができる。組合せ集合を圧縮するのに適したデータ構造であるZDDを利用する
ことで、ツイッターのような組合せ集合の形式で表現されるデータ間の距離をより
合理的に測定し、分類する手法を提案する。

footer 情報処理学会 セキュリティ プライバシーポリシー 倫理綱領 著作権について