6S-08
大規模並列深層学習のための目的関数の平滑化
○長沼大樹,横田理央(東工大)
深層学習では極めて膨大な学習データを用いて学習することで他の機械学習手法を圧倒する高い性能を発揮している一方,
その膨大な計算時間のため,大規模並列化によって学習時間を短縮するのが喫緊の課題である.
深層学習における問題は訓練データとの誤差を表す関数の最小化問題に帰結するが,
近年の研究によって,大規模並列化に伴うバッチサイズの増加により得られる学習モデルの汎化性能が劣化することが示されている.
本研究ではこの問題の解決方法として目的関数に対する平滑化に着目し,
バッチサイズの増加を伴っても汎化性能を劣化させない目的関数の平滑化手法について検証を行う.

footer 著作権について 倫理綱領 プライバシーポリシー セキュリティ 情報処理学会