2M-08
学習モデルの相互情報量に基づく学習進行度分析
○栗林 諒,関本快士,安田宗樹(山形大)
過学習は機械学習における最大の問題の一つである。過学習を避けるためには学習進行状況をモニタリングし、適切なタイミングで学習を終了する必要がある。学習進行状況のモニタリングには通常検証データ(テストデータ)が用いられる。本研究の目的は、訓練データのみからモデルの学習進行状況を把握し、学習早期終了点や過学習点を検知することを可能とすることである。これが実現すれば究極的には検証データが不要となり、少データ学習の場合などへの応用が期待できる。確率的3層ニューラルネットワークを基礎に、モデル内部(つまり、中間層)の相互情報量を分析し、分析結果に基づき学習の進行度を示す指標を提案する。