Problem

當前 AI 代理人(Agent)缺乏一套形式化的執行架構,使得後設代理人(Meta-agents)難以有效地監控、介入或在特定狀態下進行分支實驗。現有的環境模擬方案(如 Docker)在處理狀態復原與重放(Replay)時,往往面臨執行速度過慢以及計算資源浪費的問題。

Method

開發名為 Shepherd 的函數式編程模型,利用 Lean 語言將核心操作形式化,並將代理人與環境的互動記錄為 Git 風格的類型化事件軌跡。該系統能以比 Docker 快 5 倍的速度分支代理人程序與檔案系統,並在重新執行時達成超過 95% 的提示詞快取(Prompt-cache)重用率。

Results

實驗證明 Shepherd 在三大應用中表現卓越:在協作編碼測試中,即時督導使成功率從 28.8% 提升至 54.7%;反事實優化在多項基準測試中進步達 11 分,並節省 58% 的執行時間;在強化學習訓練(Tree-RL)中,透過分支探索將效能從 34.2% 提高至 39.4%。

Significance

Shepherd 為開發複雜的後設代理人系統提供了高效且可靠的基礎設施。透過形式化的追蹤與極速的分支能力,本研究不僅大幅加速了 AI 代理人的最佳化與訓練流程,更為未來具備自我修正與高度協作能力的 AI 系統奠定了關鍵的技術架構。