賦能上下文優化：結合主動資訊搜尋技術，顯著提升大語言模型特定領域適應力

本研究開發出結合搜尋工具的主動資訊尋求框架，透過動態篩選候選上下文，解決模型無法即時更新外部知識的困境，在翻譯、醫療與推理等多項複雜任務中展現優異效能。

Problem

大型語言模型部署後的更新成本極高，且現有的上下文優化方法多為「閉環」模式，僅能依賴模型內部的既有知識，難以處理新生成的資訊或特定的小眾領域需求。

研究團隊為上下文優化器配備了 Wikipedia 搜尋與瀏覽器工具，並提出一套搜尋式訓練程序。該程序能動態維護並修剪多組候選上下文，有效克服了單純加入搜尋工具反而可能導致效能下降的問題。

實驗證明，此方法在低資源翻譯（Flores+）、醫療場景（HealthBench）及高強度推理任務（LiveCodeBench）中均有顯著進步。此外，該方法具備高資料效率與穩健性，且生成的文本上下文可在不同模型間通用。

這項研究提供了一種更具成本效益的模型適應路徑，證明透過主動獲取外部資訊並優化上下文管理，能打破模型封閉知識的限制，大幅擴展大語言模型在專業領域的應用潛力。