4V-02
コンセプトドリフト対処のための、Adversarial Validationを用いた学習データ選択に関する考察
機械学習コンテストにおいてはよく利用されるAdversarial Validationを用いた先行研究は知りうる限り少ない。Adversarial Validationとは、機械学習において訓練データとテストデータの分布の違いを検出するアプローチのことで、その分布の違いを加味して訓練データを調整することによって、より精度の高いモデルを得るなどの目的で利用される。
本論文では、Adversarial Validationをコンセプトドリフトの問題解決のために利用した先行研究の内容を拡張し、特徴量選択ではなくデータ選択の観点からバリデーションを行う方法について実験を行った。その結果、特徴量選択を行うよりも精度が向上するケースがあることを評価した。