情報処理学会第85回全国大会 会期:2023年3月2日~4日 会場:電気通信大学

4M-02
BERTを用いたフィルタリングによるTwitterからの教師データ作成手法
○金澤滉典,櫻井義尚(明大)
教師データセットの作成において、BERTによるプレフィルタリングを用いたサンプリングにより不均衡化を緩和する手法を提案し、その有効性を検証した。
今回はTwitter からの意見抽出を課題とし、ツイートから教師データセット作成を行う際のサンプリングフィルタを、辞書による機械的抽出からBERTを用いたモデルによる抽出に変更した。それによって抽出されたデータセットの不均衡緩和効果の検証を実施し、そのデータセットを用いた意見抽出モデルの作成と精度検証を行うことで、ランダムサンプリングで作成したデータセットを用いて学習した意見抽出モデルとの比較評価を行い、その有効性を検証した。