5A-02
nbodyシミュレーションのマルチGPU環境における最適化
○亀ノ上剛(日本IBM)
一般にGPUの高い演算能力を引き出すためには、GPUの持つ多数の浮動小数演算ユニットを飽和させるだけの高速なデータ供給が求められる。
多体問題のnbodyシミュレーションでは、CPUのメモリーに置く時間ステップ毎に更新されるn個の質点の位置情報を、全てのGPUから参照する。従って、nが大きい場合はCPU-GPU間の大量のデータ転送が発生する。
本論文では、シングルGPU実行の場合に、CPU-GPU間のデータ転送バンド幅がnbodyの性能に影響していることを示し、高速なNVLink接続に変更することで約3倍の性能向上を得た。
さらに、マルチGPU実行の場合に、CPU側でのデータ転送がボトルネックとなりnbodyの性能がスケールしないことを示し、メモリーインターリーブを使うことで約2倍の性能向上を得た。

footer 著作権について 倫理綱領 プライバシーポリシー セキュリティ 情報処理学会