情報処理学会 第88回全国大会

6H-01
小規模データセットを用いた指示チューニングによる小型言語モデルの商用実装
○洪  鵬,辻菜々実,上野雅史,黒澤郁音,谷口 敦,大野雅生,佐藤 哲(パーソルキャリア)
近年、OSSの小型言語モデル(SLM)とチューニング手法が相次いで公開され、開発が容易となっているが、企業が独自データでSLMを調整するには、データ準備や技術導入のコストが高く、一般ユーザー向けに商用提供するまでに至る事例は依然として限られる。そこで本発表では、約200件の小規模データセットを構築し、指示チューニングを適用して、求職者の職務経歴書作成に特化したSLMを約3ヶ月で開発した取り組みを報告する。モデル性能はLLM-as-a-Judgeで評価し、特定タスクにおいてgpt-4o-miniを上回る精度を確認した。さらに自社サービスへの実装と運用結果も併せて示す。