企業系統是否需要學習世界模型？結合執行期探索技術應對動態配置與環境遷移

針對企業系統中因租戶配置差異導致的環境變動，本研究提出「企業探索代理人」，透過在執行期讀取系統配置而非僅依賴預訓練模型，有效提升了跨環境部署的預測準確度與穩定性。

Problem

傳統世界模型在企業系統中容易因部署遷移（deployment shift）而失效。由於企業邏輯往往隨租戶配置而異且會隨時間演進，僅依賴歷史資料訓練的模型難以應對環境動態的改變。

提出「企業探索代理人」（Enterprise Discovery Agents）架構，並建立專門測試企業連鎖預測能力的基準 CascadeBench。該方法讓代理人在執行期（runtime）透過讀取當前系統配置來獲取轉移邏輯，將預測過程錨定於實際的系統實例，而非僅憑藉內化的靜態表徵。

實驗結果顯示，離線訓練的世界模型在同分佈資料下表現良好，但當環境動態改變時性能會劇烈衰減；相較之下，具備探索機制的代理人能即時對應當前實例的配置，在部署遷移的情況下展現出極高的魯棒性。

本研究指出在可配置的企業環境中，AI 代理人不可僅依賴固定的內化權重，必須整合執行期發現機制。這為開發具備高度適應力、能處理複雜企業工作流程的自主代理人提供了重要的技術方向。