1K-02
誤ラベルを含むデータ集合を用いた統計的機械学習
○鈴木美香,安田宗樹(山形大)
通常の統計的機械学習は,誤ってラベル付けされた誤ラベルデータの存在を許容しない.しかしながら,通常,ラベルは人手で付与されるため,誤ラベルデータが混入する可能性がある.本講演では,誤ラベルデータを含むデータ集合を利用した2つの統計的機械学習の方法について考える.一つ目は(1)ラベルの正誤情報が付加されている場合の学習であり,二つ目は(2)正誤情報が付加されていない場合の学習である.普通,誤ラベルがいつ発生するかは未知なので,実用上は(2)の学習法が重要である.(2)の学習法は誤ラベルの発生率をハイパパラメータとして設定する必要がある.本講演では,発生率の推定法まで議論する予定である.

footer 著作権について 倫理綱領 プライバシーポリシー セキュリティ 情報処理学会