5B-04
アクセスログからの大域的特徴量を考慮したユーザ属性推定
○佐藤 哲(NHNテコラス)
ネットワーク社会におけるサービスログデータの分析は,重要性が増す一方で膨大に蓄積されているデータ量も問題になっている.しかし近年では,Hadoopエコシステムなどビックデータに対応する基盤が普及しつつある.そこで本発表では,Hadoop上に構築したApache Sparkシステムを利用して長期間のデータを追跡し,局所的な特徴量に加え長期間のトレンド情報を推定し,短期及び長期のデータをクラスタリングすることで,先行研究よりも詳しいユーザ属性を推定する手法を提案する.

footer 著作権について 倫理綱領 プライバシーポリシー セキュリティ 情報処理学会