情報処理学会 第87回全国大会

1U-03
潜在空間上におけるDenoising Diffusion GANによる画像生成品質の向上と効率化
○石戸 諒,藤田 悟(法大)
拡散モデルは高品質かつ多様な画像生成に優れた手法として注目を集めているが、生成速度の遅さが依然として大きな課題である。特に、多数のノイズ除去ステップが必要となるため、推論時の計算負荷が高い。Denoising Diffusion GAN (DDGAN) は条件付きGANを導入することでノイズ除去ステップ数を削減し、生成速度を向上させたが、生成品質や計算効率の点で改善の余地がある。本研究では、Variational Autoencoder (VAE) を用いて画像を低次元の潜在空間に圧縮し、その潜在空間上でDDGANを学習することで生成品質を維持しつつ生成速度を向上させる手法を提案する。CIFAR-10およびCelebA-HQデータセットを用いた実験において、提案手法は既存の拡散モデルやDDGANを上回る生成速度を示した。