模仿大腦「遺忘曲線」：新款 AI 記憶管理工具大幅提升 RAG 效率並節省 84% 成本

針對傳統 RAG 系統常因儲存過多無用資訊而導致效率下降的問題，開發者推出一套模擬生物遺忘機制的開源工具。透過艾賓浩斯遺忘曲線管理記憶強度，結合向量與圖形資料庫，讓 AI 能自動篩選重要資訊，成功將檢索準確度提高一倍，並顯著降低 Token 消耗成本。

在當前大語言模型（LLM）的應用框架中，檢索增強生成（RAG）被視為解決模型幻覺與知識更新問題的核心技術。然而，現有的 RAG 架構往往面臨「記憶過載」的瓶頸。大多數系統將記憶體視為一個靜態的檔案櫃，無論是暫時性的程式碼修復建議，還是早已廢棄的開發規則，都會被永久儲存在向量資料庫中。隨著時間推移，這些過時的雜訊會充斥整個 Context Window，不僅大幅拉高了 Token 的使用成本，更會干擾 AI Agent 的推理品質，使其在處理複雜任務時顯得力不從心。

近期在技術社群引起關注的一個開源專案，試圖從生物學的角度解決這個難題。該專案引入了著名的「艾賓浩斯遺忘曲線」理論，將 AI 的記憶管理轉向一種動態的「生物基質」模式。在這種設計下，每一條存入系統的記憶都會被賦予一個「強度」評分。當資訊被反覆檢索或使用時，其強度會隨之增強，且衰減曲線會變得平緩（即間隔重複效應）；反之，若某些資訊長期未被觸及，強度便會隨時間遞減，最終在低於特定閾值時被系統自動剔除。這種「主動遺忘」的機制，確保了 AI 的上下文空間始終保留最具價值的內容。

除了遺忘機制，該專案還針對傳統向量搜尋的侷限性進行了改良。在處理複雜邏輯時，語義上不相似但邏輯上高度相關的資訊，往往會被單純的向量搜尋遺漏。為此，開發者在向量儲存層之上疊加了一層圖形資料結構，用以捕捉資訊間的邏輯關聯。根據 LoCoMo 資料集的基準測試顯示，這種結合生物遺忘與圖形結構的做法，讓 Recall@5 的檢索準確度達到了 52%，幾乎是傳統無狀態向量儲存的兩倍，同時還節省了約 84% 的 Token 資源損耗。

這項發展對產業具備深遠意義，特別是對於需要處理長期、持續性專案的 AI Agent 而言。開發者不再需要手動清理資料庫，系統能自發性地進行資料「代謝」。該專案採用 Model Context Protocol (MCP) 架構並搭配本地優先的 DuckDB，顯示出當前技術趨勢正從單純的「大數據堆疊」轉向「高品質精鍊」。對於台灣的開發者或企業應用來說，這提供了一個實用的思考方向：在追求模型參數規模與資料量的同時，如何讓 AI 學會「遺忘」，或許才是提升系統長效穩定性與降低營運成本的關鍵所在。