情報処理学会 第88回全国大会

6X-06
大規模言語モデルを用いた意見データセットの生成
○高田悠平,本多泰理,佐野 崇,中村周吾(東洋大)
意見分析のためのモデルを学習するためには、高品質な意見データセットが必要となる。しかし実データはバイアス等を含み、単純な合成データは画一的であるという課題がある。本研究では、大規模言語モデル(LLM)を用いて、動的なペルソナ生成とRAGを組み合わせることで、任意のトピックに対して論理構造やスタンスが明確かつ制御可能な意見データを生成することができるフレームワークを提案する。評価実験の結果、実データに匹敵する多様性(平均コサイン距離等)、指定したスタンスの再現性(F1スコア等)、および意見分析モデルのための学習データとしての有用性を確認した。