情報処理学会 第86回全国大会 会期:2024年3月15日~17日

1J-05
OpenACCを用いた単精度LU分解のGPU並列化
○高山智礼,久木田仁,矢島雄河,藤井昭宏,田中輝雄(工学院大)
機械学習の分野では大容量の学習データ自体の精度が低いため,GPUの単精度(あるいは半精度)演算の高い計算能力が注目されている.しかし,GPUの取り扱いにCUDAを用いるとCPU向けのプログラムを大幅に書き換える必要がある.そのため書き換えを大幅に削減可能な,ディレクティブベースのGPU向けプログラミングモデルOpenACCによる利用が広がっている.一方,スーパーコンピュータのベンチマークHPL-MxPでは混合精度演算が用いられており,ここでの主な演算である密行列のLU分解も単精度(あるいは半精度)演算である.本研究では, OpenACCを用いて,HPL-MxP内のLU分解(単精度)をGPU上で並列化し,CPU上での実行を越える性能を得た.