3B-02
低更新頻度データを対象としたSQL-on-Hadoopエンジンの時空間効率の比較と評価
○趙 漢哲(NHN comico)
Hadoopの登場は今まで不可能だった大規模のデータの蓄積と分析を可能にした。特にHiveのようなSQL-on-Hadoopエンジンを利用することでSQLに慣れているデータ分析家であれば特別なトレーニングを受けなくても容易にHadoopのパワーを活かすことができた。しかし、既存のRDBMSとは違ってHadoopではデータ更新や遅延挿入が困難な問題点も存在する。本論文では商品マスターテーブルのように更新頻度が低いデータを対象として複数のSQL-on-Hadoopエンジンの時空間効率を比較する。幅広く使われているがデータ更新や遅延挿入ができないHiveとそれらが可能になったHive-on-HBase、Phoenixを比較することで扱うデータの特性によってどのアプローチを取ることがデータの蓄積と処理に有利なのかを判断することが可能である。

footer 著作権について 倫理綱領 プライバシーポリシー セキュリティ 情報処理学会