Problem

大型語言模型部署後的更新成本極高,且現有的上下文優化方法多為「閉環」模式,僅能依賴模型內部的既有知識,難以處理新生成的資訊或特定的小眾領域需求。

Method

研究團隊為上下文優化器配備了 Wikipedia 搜尋與瀏覽器工具,並提出一套搜尋式訓練程序。該程序能動態維護並修剪多組候選上下文,有效克服了單純加入搜尋工具反而可能導致效能下降的問題。

Results

實驗證明,此方法在低資源翻譯(Flores+)、醫療場景(HealthBench)及高強度推理任務(LiveCodeBench)中均有顯著進步。此外,該方法具備高資料效率與穩健性,且生成的文本上下文可在不同模型間通用。

Significance

這項研究提供了一種更具成本效益的模型適應路徑,證明透過主動獲取外部資訊並優化上下文管理,能打破模型封閉知識的限制,大幅擴展大語言模型在專業領域的應用潛力。