Shepherd：以形式化執行軌跡賦能後設代理人，大幅提升大型語言模型開發與最佳化效率

本研究提出 Shepherd 框架，透過 Git 風格的執行軌跡與極速分支技術，讓後設代理人能精準控制與優化目標代理人，顯著提升 AI 系統的執行效率與任務表現。

Problem

當前 AI 代理人（Agent）缺乏一套形式化的執行架構，使得後設代理人（Meta-agents）難以有效地監控、介入或在特定狀態下進行分支實驗。現有的環境模擬方案（如 Docker）在處理狀態復原與重放（Replay）時，往往面臨執行速度過慢以及計算資源浪費的問題。

開發名為 Shepherd 的函數式編程模型，利用 Lean 語言將核心操作形式化，並將代理人與環境的互動記錄為 Git 風格的類型化事件軌跡。該系統能以比 Docker 快 5 倍的速度分支代理人程序與檔案系統，並在重新執行時達成超過 95% 的提示詞快取（Prompt-cache）重用率。

實驗證明 Shepherd 在三大應用中表現卓越：在協作編碼測試中，即時督導使成功率從 28.8% 提升至 54.7%；反事實優化在多項基準測試中進步達 11 分，並節省 58% 的執行時間；在強化學習訓練（Tree-RL）中，透過分支探索將效能從 34.2% 提高至 39.4%。

Shepherd 為開發複雜的後設代理人系統提供了高效且可靠的基礎設施。透過形式化的追蹤與極速的分支能力，本研究不僅大幅加速了 AI 代理人的最佳化與訓練流程，更為未來具備自我修正與高度協作能力的 AI 系統奠定了關鍵的技術架構。