情報処理学会 第84回全国大会 会期:2022年3月3日~5日 情報処理学会 第84回全国大会 会期:2022年3月3日~5日

5V-05
SeqGANを用いたマイクロブログの文章自動生成に関する研究
○三村 亮(小松大)
 深層学習を用いて分類問題を解く際に,各カテゴリのデータ数が不均衡な場合,学習が困難であることが知られている.入力データとして不均衡データを用いた場合,少数派カテゴリは分類精度が低い課題がある.その課題の解決方法として,データを事前にサンプリングし,データ量の不均衡さを解消する方法が用いられている.サンプリング手法では,多数派カテゴリのデータ量を減らすアンダーサンプリング,少数派カテゴリのデータ量を増やすオーバーサンプリングと大別される.本研究では,SeqGANを用いてマイクロブログ上の文章の自動生成を行い,オーバーサンプリングを行う手法を提案する.