情報処理学会第84回全国大会講演論文集

2V-06

深層学習における2次最適化の汎化性能の検証

○石井　央，横田理央（東工大）

深層ニューラルネットワークの最適化には通常1次の最適化手法である確率的勾配降下法（SGD）が用いられるが，自然勾配法のような2次の最適化手法が収束性を大幅に向上できるケースも報告されている．これまで，深層学習に2次最適化が用いられてこなかった理由としては，その計算コストが膨大であることと過学習しやすいことが挙げられる．大沢らは分散並列環境下ではFisher行列の計算を分散させることで計算コストを大幅に低減できることをしめしたが，過学習の問題に関しては限定的なデータセットとモデルでしか改善できていない．本研究では，2次最適化のより広範なデータセットとモデルに適用した場合の汎化性能について検証する．