4U-02
拡散モデルを用いた動画生成における制御手法の開発への取り組み
○杭 雨欣,小林一郎(お茶の水女子大)
拡散モデルを用いたテキストから画像や動画を生成する技術は近年盛んに研究されて
いる。しかし、生成された動画の評価方法には課題があり、既存の数値評価はしばしば
人間の直感と一致しない。この背景から、動画生成モデルの性能を複数の観点で評価し
、さらに特定の能力を向上させる必要がある。
本研究では、拡散モデルを活用し、VBenchの美学スコアを組み込んだ新たな損失関数
を設計することで、低解像度ビデオから高解像度ビデオを生成する手法を開発した。こ
の手法では、時間的一貫性を保ちながら動画の微細な箇所を生成し、フレーム間の不一
致を改善することで、視覚的に優れた結果を得ることができた。