PREPING：突破冷啟動限制，透過自主合成練習建立高效 AI 代理人程序性記憶

本研究提出 PREPING 框架，讓 AI 代理人在面對陌生環境時，能透過自主生成的合成任務進行預先練習。藉由提案者引導與篩選機制，代理人可在無任務經驗下建立高品質記憶，顯著降低部署成本並提升效能。

Problem

代理人在進入新環境時常面臨「冷啟動」困境，即在缺乏具體任務經驗或人工示範的情況下，難以立即有效運作。現有的記憶建構方式高度依賴事後互動或預先標記的資料，這使得代理人在初次面對新領域時，往往因缺乏背景知識而表現不佳。

Method

開發名為 PREPING 的提案者引導架構（Proposer-guided framework）。該系統核心為「提案者記憶」，負責引導未來的練習方向。流程包含：提案者根據當前狀態生成合成任務、執行者嘗試達成任務，以及驗證者篩選高品質軌跡存入記憶，同時向提案者提供回饋。此機制確保了合成練習具備可行性、不重複且涵蓋範圍廣。

Results

在 AppWorld、BFCL v3 與 MCP-Universe 的實驗顯示，PREPING 顯著優於無記憶的基準模型，且表現能與依賴線下或線上經驗的強大方法抗衡。在部署成本上，PREPING 比線上記憶建構法分別在 AppWorld 降低了 2.99 倍、在 BFCL v3 降低了 2.23 倍。研究證實效能提升的主因在於對任務的可控性與選擇性更新，而非單純增加資料量。

Significance

此研究證明了代理人具備「預先建構記憶」的可能性，不僅大幅縮小了冷啟動的技術缺口，更提供了一套低成本、高效率的自主學習路徑。這讓 AI 代理人能在正式執行任務前，就透過自我練習做好準備，對提升自主系統的實用性與降低運算負擔具有重要貢獻。