3J-04
GPGPUを用いたSparkによるグラフ並列処理方法の提案と評価
○稲本裕貴,青山幹雄(南山大)
グラフ構造のビッグデータを高速処理するための並列分散処理の必要が高まっている.しかし,異なる並列計算環境を組み合わせ高速化した処理方法は一般的に自明でない.本稿では,ハードウェアレベルでの高速化が可能であるGPGPUを使用し,インメモリ型の並列分散処理フレームワークであるApache Sparkを高速化する処理方法を提案する.インメモリ型であるSparkのデータ配置モデルをGPGPUに適用するために拡張する.GPUの多数のコアの使用率を向上するために,Sparkの処理単位であるStage毎の処理回数に応じてGPUで処理をするデータサイズを可変とする.提案方法とSpark単体の場合,およびGPGPUを用いたHadoopとのグラフ処理速度を比較し提案方法の評価を行う.

footer 情報処理学会 セキュリティ プライバシーポリシー 倫理綱領 著作権について