5V-05
SeqGANを用いたマイクロブログの文章自動生成に関する研究
深層学習を用いて分類問題を解く際に,各カテゴリのデータ数が不均衡な場合,学習が困難であることが知られている.入力データとして不均衡データを用いた場合,少数派カテゴリは分類精度が低い課題がある.その課題の解決方法として,データを事前にサンプリングし,データ量の不均衡さを解消する方法が用いられている.サンプリング手法では,多数派カテゴリのデータ量を減らすアンダーサンプリング,少数派カテゴリのデータ量を増やすオーバーサンプリングと大別される.本研究では,SeqGANを用いてマイクロブログ上の文章の自動生成を行い,オーバーサンプリングを行う手法を提案する.