情報処理学会 第84回全国大会 会期:2022年3月3日~5日 情報処理学会 第84回全国大会 会期:2022年3月3日~5日

7J-04
マルチGPU上でのC++実装による畳み込みニューラルネットワークの並列処理
○綿貫 幸,吉田明正(明大)
畳み込みニューラルネットワーク(CNN)は画像分類や物体検出などに広く利用されているが,大量のデータによる学習が必要とされ,処理時間の短縮が課題となる.CNNで実行される行列演算の高速化には,GPUが活用されている.また,深層学習を並列処理により高速化・軽量化する手法として,モデル並列とデータ並列がある.本稿では,C++実装によるCNNを用いた画像分類プログラムに対してデータ並列を適用することで,マルチGPU環境での学習高速化を実現する.マルチGPU向け並列プログラムはCUDAとOpenMPを用いて作成されており,NVIDIA RTX A5000搭載サーバ上で行った性能評価の結果,提案手法の有効性が確認された.