情報処理学会 第88回全国大会

7ZJ-01
次元削減と二値分類確率を組み合わせた SMOTE-CatBoost による学生ステータス多クラス予測モデル
○片桐里菜,加藤由花(東京女子大)
教育ビッグデータを用いた学習分析では:(i)多クラス分類において、出現頻度の低い少数クラスに属するレコードの識別精度が低い;(ii)学習パイプラインがドメイン固有の知識に強く依存し、汎用的な分析手法の設計が困難であるという2つの課題が存在する。本研究は、これらの課題を解決するため、不均衡データに対応した新しい学習分析モデルとして、SMOTE-CatBoostモデルを基盤とした拡張手法を提案する。提案モデルは、線形判別分析による教師あり次元削減と、階層的な二値分類確率から得られる補助特徴量を統合することを特徴としている。複数の実データセットを用いた評価実験により、提案手法の有効性を検証する。