情報処理学会第88回全国大会

近年、少数ショット環境における画像認識手法の研究が進展しており、特に大規模事前学習モデルを活用した手法が注目されている。本研究では、マルチモーダルモデルであるCLIPを用いた少数ショット画像認識の精度向上を目指し、軽量学習手法であるLoRAの適用とそのパラメータ変更による影響を検討した。具体的には、LoRAのランクを含む複数のハイパーパラメータ設定を変更し、分類精度の比較を行った。また、テキストエンコーダに与えるプロンプト文の設計の違いが認識性能に与える効果についても評価した。これらの検討により、最適なLoRAパラメータを用いることで先行研究を上回る精度を達成した。