情報処理学会 第87回全国大会

4P-02
拡散モデルを用いた感情と音楽属性に着目した音楽生成への取り組み
○川邉もゆ,小林一郎(お茶の水女子大)
拡散モデルとは、近年、生成AIの分野において生成品質・拡張性が高く、学習を安定に行えるなどの点で注目されている手法である。しかし拡散モデルにおいて、テキスト以外で表現される感情を用いて生成する手法はあまり発展しておらず、音楽属性値のような複雑な属性に対する制御も難しい。
本研究では、 Diffusion Language Model(DLM) を用いることで多様な音楽生成に制御性を加える、入力となる感情をラッセルの感情円環グラフ上の座標値とすることで微小な感情の変化の表現を可能にする、感情と相関の高い音楽属性に対して制御を行う分類器を作成する、という3つのアプローチを用いることで、多様な感情を制御対象とした音楽生成手法の開発を行う。