情報処理学会 第88回全国大会

6X-01
ドメイン特化疑似データを用いたXの感情分析による日経平均株価騰落予測の精度比較
○篠原晴大,櫻井義尚(明大)
本研究は、X(旧Twitter)の投稿を用いた感情分析による日経平均株価予測の精度向上を目的とする。金融SNS領域ではアノテーション済みデータが不足しており、LLMによる疑似データ生成が有効とされるが、生成データの表現が単調になる「語彙多様性の欠如」が課題であった。そこで本稿では、実データのクラスタリングに基づく「ペルソナ駆動型データ合成手法」を提案する。多様な投資家ペルソナを通じて生成された疑似データは、従来手法と比較して語彙多様性(Distinct-n)が大幅に改善した。本手法により学習した感情分析モデルを用い、株価予測精度の向上を検証する。