Problem

代理人在進入新環境時常面臨「冷啟動」困境,即在缺乏具體任務經驗或人工示範的情況下,難以立即有效運作。現有的記憶建構方式高度依賴事後互動或預先標記的資料,這使得代理人在初次面對新領域時,往往因缺乏背景知識而表現不佳。

Method

開發名為 PREPING 的提案者引導架構(Proposer-guided framework)。該系統核心為「提案者記憶」,負責引導未來的練習方向。流程包含:提案者根據當前狀態生成合成任務、執行者嘗試達成任務,以及驗證者篩選高品質軌跡存入記憶,同時向提案者提供回饋。此機制確保了合成練習具備可行性、不重複且涵蓋範圍廣。

Results

在 AppWorld、BFCL v3 與 MCP-Universe 的實驗顯示,PREPING 顯著優於無記憶的基準模型,且表現能與依賴線下或線上經驗的強大方法抗衡。在部署成本上,PREPING 比線上記憶建構法分別在 AppWorld 降低了 2.99 倍、在 BFCL v3 降低了 2.23 倍。研究證實效能提升的主因在於對任務的可控性與選擇性更新,而非單純增加資料量。

Significance

此研究證明了代理人具備「預先建構記憶」的可能性,不僅大幅縮小了冷啟動的技術缺口,更提供了一套低成本、高效率的自主學習路徑。這讓 AI 代理人能在正式執行任務前,就透過自我練習做好準備,對提升自主系統的實用性與降低運算負擔具有重要貢獻。