Problem
目前 AI 代理人在檔案系統中的個人化應用受限於資料稀缺與隱私屏障。現有方法過度依賴對話紀錄,忽略了檔案操作中蘊含的密集行為軌跡,導致難以進行大規模訓練與精準評估。
Method
提出 FileGram 框架,包含三大核心:FileGramEngine 負責模擬真實工作流並生成精細的多模態行動序列;FileGramBench 用於測試配置重構與軌跡解構能力的基準測試;FileGramOS 則捨棄對話摘要,改以底層原子操作與內容差異,構建程序性、語義與情節式記憶通道。
Results
實驗證實 FileGramBench 對現有先進記憶系統極具挑戰性。同時,FileGramEngine 能有效產出高品質模擬資料,而採用 FileGramOS 架構的系統在理解使用者行為細節與維持個人化特質上,表現優於傳統的記憶模型。
Significance
此研究開源了完整的工具鏈,突破了檔案系統操作資料獲取的困境。其「由下而上」的記憶架構,為開發能深入理解使用者作業習慣、具備高度個人化能力的次世代 AI 助手奠定了基礎。