情報処理学会 第87回全国大会

1D-01
Multimodal LLMを用いた動画詳細情報に対するVQA推論手法の検討
○内藤美里,進 泰彰,三輪祥太郎(三菱)
Videoに対するMultimodal LLMの開発が盛んであるが、精度面では依然として課題が残る。
本研究では、動画における詳細情報に対するVideoQA推論手法についての検討・評価結果を報告する。