1X-04
ペルソナ駆動型データ合成手法を用いた疑似データの多様性評価
○富田康太,櫻井義尚(明大)
SNS上の投稿データから機械学習を用いて意見を抽出する研究において、不均衡な教師データセットにLLMで生成した疑似データを追加することで意見抽出の精度向上を図る研究がある。また、生成した疑似データが単一であったことを受け、新たにペルソナ駆動型データ合成手法を用いることで多様性に富んだ疑似データを生成する研究が進められた。
しかし、この研究ではペルソナ駆動型データ合成手法を用いることによる精度向上は確認されたものの、データの多様性向上は実際に確認されていない。そこで、本研究では多様性等生成データの特徴の分析を行い、指標と精度の関係及び「どのようなデータを作れば精度は上がるか」を明らかにする。