3B-01
Spark/Hadoopを用いたユーザアクセスデータの解析基盤構築
○佐藤 哲(NHN comico)
弊社の多くのサービスは,ユーザがオンラインでありネットワークを通してサーバとデータ通信を行うことが前提となっている.そのため,サーバ側にはユーザのアクションに伴うアクセスログが保存されており,その分析のための速度や精度の向上が絶えず課題となっている.データはHadoopクラスタ上に保存されているが,従来のMapReduce処理では複雑な統計解析は本質的に適さない.我々はSparkクラスタ環境を導入することで計算機統計や機械学習を実施可能な環境を構築することを目指しており,本発表ではその概要に付いて述べる.

footer 著作権について 倫理綱領 プライバシーポリシー セキュリティ 情報処理学会