2B-6
MapReduceを用いたログ間の依存関係ツリーの抽出アルゴリズムの提案
○張 一凡,竹内 格(NTT)
本研究では大量のログデータ中に埋もれているツリー構造を高速に抽出するアルゴリズムを提案する.大量のログから抽出されるツリー構造は,レコメンデーションにおける予測やデータマイニングにおいて活用することができる.
大量なデータの分析には分散処理が有効である.しかし,ツリー構造の抽出にはログ間の関連分析や,関連ログから続く連鎖的な検索処理が必要となるため,処理の分散化が困難であった.提案アルゴリズムではMapReduceでのソート処理を活用し,分散処理での依存関係検索の課題を解決する.