情報処理学会 第87回全国大会

5R-03
WebNavix: ドメイン別Mixture-of-Expertsによる継続的汎用ウェブナビゲーションエージェント
○塩畑晴人,柴沼 厳(茨城高専)
最近の Web Navigation に関する研究は、意思決定エンジンとしての LLM の In-context Learning の工夫や、フレームワーク全体の改善にフォーカスしていることが多い。一方で、このタスクにおける LLM の Fine-tuning の工夫は、十分に探求されていない領域である。特に、エージェントの未知ドメインや未知ウェブサイトへの汎化は、Web Navigation 全体の根本的な課題として根強く残されている。本論文では、この課題を解決するための手法として WebNavix を提案する。WebNavix は、個別に学習されたドメイン専門家としての Fine-tuned LLMs を統合する Mixture-of-Experts に基づくドメイン別モデルマージの方法を、初めて Web Navigation に導入する。実験では、事前学習済みの LLM を WebNavix に基づいて訓練することで、従来手法と比較して未知ドメインや未知ウェブサイトへの汎化能力を効率的に獲得することを示す。この実験により、WebLINX による評価において、WebNavix は最近の手法に対して一貫した性能向上を示した。この成功の一方で、WebNavix は、長い推論時間によるリアルタイム性の欠如や、エージェントの誤操作によって被るインストラクターの損失問題などの、実用化に際して解決しなければならない課題を多数残している。我々はすべての成果物を公開し、本研究が自然言語ユーザーインターフェースの実用化の一助になることを願う。