5J-02
誤り教師データを含むデータセットを用いた統計的機械学習に関する研究
○小堀美香,安田宗樹(山形大)
機械学習は大量のデータを利用して,与えられた課題に適合するように我々が仮定するモデルを最適化するための計算手法であり,特に確率モデルをベースとした機械学習は統計的機械学習と呼ばれる.統計的機械学習は最尤法を用いて実行される.しかし,通常の最尤法はすべてのデータが正しいと仮定した学習であるので,データの中にエラーが含まれる場合は正しい学習結果を与えるとは限らない.本講演では,教師データに誤りを含むデータセットを用いた確率的識別モデルの統計的機械学習法を提案し,提案法を用いれば誤りを含むデータセット下でも良好な学習が行えることを示す.提案法の枠組みはあらゆる識別モデルに対して適用可能である.

footer 著作権について 倫理綱領 プライバシーポリシー セキュリティ 情報処理学会