4A-2
POWER7/VSX機構向けアラインメント最適化
○吉田美里,橋本博幸,本川敬子(日立)
POWER7プロセッサはSIMD演算が行えるVSX機構を搭載しており,
SIMD命令の利用により1命令で16バイトデータの演算を行うことができる.
連続的な配列参照を含むループのSIMD化で生成する16バイトデータの
ロード・ストア命令に対して,対象データのアラインメントの違いによる
実行性能の差異を調査した.アンアラインなSIMDロード・ストア実行
を削減するために,ループの初回参照がアンアラインな配列参照に対して,
先頭イタレーションをピーリングしアラインを調整した後SIMD化を行う方式
を適用し,性能劣化が防げることを確認した.