抄録
H-006
画像識別処理のための効率的なCUDA実装に関する一考察
大西茂彦・服部静枝・細谷英一・青木 孝・小野澤晃(NTT)
HOG特徴量を用いたReal AdaBoostによる人物検出処理について,複数の異なるアーキテクチャのGPUを使用して,CUDAでの効率的な実装方法を検討した.いわゆるFermiアーキテクチャのGPUを使用した場合,スレッド数を従来よりも大きく設定できるために高速な処理が期待できる.しかし,外部メモリや共有メモリへのアクセス遅延が生じると,スレッド数の多さがかえって性能劣化につながるケースも見受けられた.最も高い処理性能を示した場合においては,576×432ピクセルの動画像を33fps以上のスループットで処理できる可能性を見出すことができた.