5L-05
Tensorコアを用いたBatched QR分解
○大友広幸,横田理央(東工大)
QR分解は固有値問題や最小二乗問題の解法として広く用いられている.
QR分解の手法の1つであるHouseholder変換を用いたアルゴリズムでは行列積計算が行われる.
本研究ではNVIDIA Voltaアーキテクチャなどに搭載されている混合精度行列計算回路であるTensorコアを用いて複数のQR分解を行うBatched QR分解を実装し,その計算速度と誤差について調査を行った.
NVIDIAが提供しているGPU用線形代数ライブラリであるcuBLASと比較しても速度面での向上が確認された.

footer 著作権について 倫理綱領 プライバシーポリシー セキュリティ 情報処理学会