4J-04
ディレクティブベースのGPUプログラミングモデルを用いた倍々精度演算の性能評価
高精度演算を用いることでKrylov部分空間法の収束を改善できる.しかし,計算時間が増加する.高精度演算のひとつに倍精度変数を2つ用いて4倍精度相当の演算を行う倍々精度(DD)演算がある.GPU上で実行するプログラムを記述する言語にCUDAがある.CUDAプログラムはCPU向けのプログラムから大幅に変更する必要がある.簡単な記述でGPUを扱う手法としてOpenACCやOpenMP Offloadingのようなディレクティブベースのプログラミングモデルがある.しかしながら,DD演算においてCUDAと比べて性能にどのような違いがあるかは明らかになっていない.本論文では,DDベクトル演算,倍精度疎行列とDDベクトルの積を対象に,ディレクティブベースのプログラムとCUDAプログラムの性能を比較した.