Problem
傳統世界模型在企業系統中容易因部署遷移(deployment shift)而失效。由於企業邏輯往往隨租戶配置而異且會隨時間演進,僅依賴歷史資料訓練的模型難以應對環境動態的改變。
Method
提出「企業探索代理人」(Enterprise Discovery Agents)架構,並建立專門測試企業連鎖預測能力的基準 CascadeBench。該方法讓代理人在執行期(runtime)透過讀取當前系統配置來獲取轉移邏輯,將預測過程錨定於實際的系統實例,而非僅憑藉內化的靜態表徵。
Results
實驗結果顯示,離線訓練的世界模型在同分佈資料下表現良好,但當環境動態改變時性能會劇烈衰減;相較之下,具備探索機制的代理人能即時對應當前實例的配置,在部署遷移的情況下展現出極高的魯棒性。
Significance
本研究指出在可配置的企業環境中,AI 代理人不可僅依賴固定的內化權重,必須整合執行期發現機制。這為開發具備高度適應力、能處理複雜企業工作流程的自主代理人提供了重要的技術方向。