2V-03
不確実性の較正評価による不変リスク最小化近似手法の比較理解
○吉田晃太朗,竹下尋紳(東工大),長沼大樹(モントリオール大学 / Mila)
近年の深層ニューラルネットワークの実応用において、学習データと異なるデータ分布に対する性能低下を扱う分布外汎化が喫緊の課題である。データの分布不変な特徴量を捉えることを目的として不変リスク最小化(IRM)が提案されているが、IRMの厳密解を求めることは困難であるため近似解法として複数の近似手法が提案されている。これら近似手法は推論精度によってのみ評価されており、実際にどの程度不変的な特徴量を獲得できているのか評価されていない。我々は、IRMの定式化が複数のドメインにわたるモデルの不確実性の較正として一般化できることに着目し、不確実性の較正を IRM の近似度合いの指標と捉え、比較評価を行った。