情報処理学会 第82回全国大会 会期:2020年3月5日~7日 会場:金沢工業大学 扇が丘キャンパス 情報処理学会 第82回全国大会 会期:2020年3月5日~7日 会場:金沢工業大学 扇が丘キャンパス

1M-05
データの複雑性を考慮した不均衡データに対するリサンプリング手法
○笹田大翔,馬場睦也,木村優介,波多野賢治(同志社大)
クラスに偏りのある不均衡なデータを機械学習に適用した場合,予測結果はその影響を受けてしまう.こうした偏りを解消する方法としては,正例と負例のサンプル数を調整するリサンプリングという手法が用いられる.しかしクラスの偏り以外にも,クラス同士が一部で重複して線形に分離できない状態などの複雑性も考慮する必要がある.これらを解消する手法は提案されてはいるが,クラス内の複雑性のみ指標として扱っている.
 そこで本研究では,これらの複雑性を考慮するために,事前に計算したクラス内およびデータ全体における複雑性を両方考慮した指標に基づいてリサンプリングを行う.