情報処理学会 第86回全国大会 会期:2024年3月15日~17日

7S-02
Vision Transformerを用いた画風変換手法の検討
○酒井天平,温泉良太,陳キュウ(工学院大)
最近では、 Diffusion modelなどの画像生成手法の研究が急速に進んでおり、特に画風変換に関する研究が盛んに行われている。本研究では、代表的な画風変換手法であるSplicing ViTをベースに、特徴抽出器である学習済みViTを変更し、画風変換の精度向上を目標とした。具体的には、先行研究で利用されていた事前学習済みDINO-ViTをregister_token付きDINOv2-ViTに変更し、モデルはDINO-ViT-B/8(先行研究モデル)、DINOv2-ViT-S/14_reg、DINOv2-ViT-B/14_regの3つのモデルでそれぞれ画風変換を試み、その結果を比較した。さらに、各モデルの特徴表現を確認するために特徴量の可視化も行い、画風変換結果の考察を行った。